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Vorwort 



Im vorliegenden Lehrbuch wird die Wissenschaftstheorie und Forschungsmethodik 
der Psychologie und der benachbarten Sozial- und Verhaltenswissenschaften behan- 
delt. Ziel ist nicht die umfassende Darstellung der konkreten Verfahrensweisen und 
Techniken der empirischen Forschungspraxis. Im Mittelpunkt stehen iibergreifende 
Voraussetzungen und Orientierungen, Probleme und Positionen, die fur ein eigen- 
standiges und kritisches Verstandnis der Vorgehensweisen, Moglichkeiten und Gren- 
zen der wissenschaftlichen Erkenntnisgewinnung notwendig oder hilfreich sind. 

• Im ersten Teil des Buches (Kapitel 2 bis 11) werden wichtige wissenschaftstheo- 
retische Grundlagen der psychologischen Forschung dargestellt. 

Angesprochen werden unter anderem folgende Fragen: 

- Was konnen wir erkennen und worauf beruhen unsere Erkenntnisse? 

- Was ist das Psychische und wodurch unterscheidet es sich vom Korperlichen? 

- Wie wird die Bedeutung wissenschaftlicher Begriffe definiert? 

- Wodurch unterscheiden sich wissenschaftliche und alltagliche Aussagen? 

- Wann sind Schlussfolgerungen logisch zwingend? 

- Wie konnen Verallgemeinerungen gerechtfertigt werden? 

- Mlissen psychologische Gesetze allgemein und ausnahmslos gelten? 

- Wie werden Sachverhalte kausal erklart? 

- Wie entstehen wissenschaftliche Theorien und Hypothesen? 

- Wie sind Theorien aufgebaut? 

- Wie konnen verschiedene Theorien miteinander verbunden werden? 

- Inwieweit konnen Theorien an der Realitat Iiberpruft werden? 

- Warum konnen Theorien nicht als wahr oder als falsch erwiesen werden? 

- Worin bestehen die Ziele der Wissenschaft? 

Zur Beantwortung dieser Fragen behandeln wir die Erkenntnistheorie und das Leib- 
Seele-Problem, die Aussagen- und Quantorenlogik, die Mengenlehre, das deduktive 
und induktive SchlieBen und die wissenschaftlichen Gesetze und Erklarungen. Die 
Entstehung, Abgrenzung und Veranderung von Theorien wird unter anderem anhand 
der bekannten Konzepte der Verifikation und Falsifikation, der Paradigmen und 
Forschungsprogramme beschrieben. Der Aufbau psychologischer Theorien sowie 
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ihre Verkniipfung und empirische Anwendung wird systematisch mit dem Instru- 
mentarium der strukturalistischen Wissenschaftstheorie analysiert. 

Da diese wissenschaftstheoretischen Thematiken in der Psychologie sehr ver- 
nachlassigt sind und haufig nur oberflachlich und isoliert abgehandelt werden, sollen 
sie hier umfassend und zusammenhangend dargestellt werden. Zu den meisten dieser 
Themen existieren zahlreiche philosophische Bucher oder Artikel mit breiteren, dif- 
ferenzierteren oder anderslautenden Darstellungen, auf die ich Interessierte jeweils 
verweisen werde. 1 

• Im zweiten Teil des Buches (Kapitel 12 bis 18) beschreibe ich, aufbauend auf den 
Ergebnissen des ersten Teils, die wesentlichen Probleme und Vorgehensweisen 
bei der Planting und Interpretation von experimentellen Untersuchungen. 

Dabei geht es nicht um die konkrete, apparative Durchflihrung von Experimenten. 
Im Mittelpunkt stehen vielmehr grundlegende Fragen der Experimentalmethodik: 

- Wann ist eine psychologische Untersuchung ein Experiment? 

- Welche Bestandteile hat ein Bericht fiber ein psychologisches Experiment? 

- Wie mussen Experimente gestaltet sein, damit sie fur die Beantwortung 
psychologischer Fragestellungen niitzlich sind? 

- Wann ist ein Experiment valide? 

- Was sind mogliche und tatsachliche Storfaktoren der Validitat? 

- Wie werden mogliche Storfaktoren am besten kontrolliert? 

- Wie werden psychologische Fragestellungen in statistische umgesetzt? 

- Wie priift man am besten Trend- und Interaktionshypothesen? 

- Welche Vor- und Nachteile hat die Anwendung von Signifikanztests? 

- Welche Voraussetzungen mussen fur einen Signifikanztest erfiillt sein? 

- Wie konnen Signifikanztests gerechtfertigt werden, wenn die Untersuchungs- 
personen keine Zufallsstichproben sind? 

- Darf man t-Tests anwenden, obwohl die Daten nicht normalverteilt sind? 

- Wann ist die Kumulation welcher Fehlerwahrscheinlichkeit auszugleichen? 

- Wie drlickt man die GroBe der gefundenen Effekte aus? 

- Was sagen statistische Ergebnisse fiber psychologische Hypothesen aus? 

- Wie konnen die Ergebnisse eines Experiments verallgemeinert werden? 

Als iibergeordnetes Kriterium fur die adaquate Planung und Interpretation psycholo- 
gischer Experimente wird die Validitat der Priifung einer empirischen Hypothese 
vorgestellt. Ausftihrlich behandelt werden auBerdem die konzeptuellen Grundlagen 
der statistischen Signifikanztests und ihre angemessene Verwendung bei der wissen- 
schaftlichen Erkenntnisgewinnung. Die statistischen Verfahren werden jedoch nicht 
im einzelnen besprochen. Sie sind in den Biichern zur angewandten Statistik 



Empfehlenswerte Einfiihrungen in die Philosophic bieten Stegmiillers Hauptstromungen 
(Stegmiiller, 1969, 1987a, 1987b, 1989), Storigs Weltgeschichte (Storig, 1999) und 
Hoffmeisters Worterbuch (Regenbogen & Meyer, 1998). 
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dargestellt. 2 Die Beweise finden sich teilweise ebenfalls dort, vor allem aber in 
Lehrblichem der mathematischen Statistik. 

Dieses Buch entstand aus Materialien fiir verschiedene Lehrveranstaltungen in 
den Fachern Methodenlehre und Evaluation und Forschungsmethodik, die ich in den 
letzten Jahren an den Universitaten Gottingen und Greifswald abgehalten habe. 

Durch diese Lehrtatigkeit bin ich mit der Skepsis und der Ablehnung konfrontiert 
worden, die bei Studierenden gegeniiber den „Methodenfachern“ zu finden sind. Auf 
den ersten Blick scheinen die Inhalte dieser Facher und Veranstaltungen schwierig 
zu sein, kaum Verbindung mit der Psychologie aufzuweisen und fiir praktische 
Tatigkeiten keine Relevanz zu besitzen. Glucklicherweise habe ich aber auch die 
Erfahrung gemacht, dass Studierende sich von der Bedeutung der Methodenlehre 
tiberzeugen lassen, mit den Konzepten und Inhalten verstandnisvoller umzugehen 
lernen und sich mitunter sogar von den zunachst versteckten Reizen dieses 
Fachgebietes anziehen lassen. Ein Flauptziel dieses Buches besteht darin, diese Form 
des erfolgreichen Studiums zu fordern. 

Dieses Buch kann in verschiedener Weise in der universitaren Lehre genutzt 
werden. Ich selbst verwende den Text als Grundlage und Erganzung von zwei zwei- 
stundigen Vorlesungen zur Einfiihrung in die Methodenlehre, die parallel zu den 

• • A 

Vorlesungen und Ubungen zur Statistik fiir Erst- und Zweitsemester stattfinden. Bei 
anderen ortlichen Gegebenheiten und personlichen Schwerpunkten konnen der Text 
oder ausgewahlte Kapitel auch in anderen einflihrenden Vorlesungen oder ver- 

tiefenden Seminaren im Grand- und Hauptstudium besprochen werden. 

• • 

AuBerlich ist dieses Buch bewusst konventionell gestaltet. Ich habe auf stichwort- 
artige Zusammenfassungen, farbig unterlegte Kasten, Ubungsaufgaben, Randhinwie- 
se und ahnliche angebliche Lernhilfen verzichtet. Nach meiner Erfahrung muss man 
einen schwierigen Stoff eigenstcindig strukturieren und zusammenfassen, um ihn 
wirklich verstehen zu konnen. 5 Auch finden sich in diesem Buch keine lustigen 
Zeichnungen, launigen Anekdoten und aufmerksamkeitserheischende Zeitungsaus- 



Didaktisch und fachlich ausgezeichnet ist das Lehrbuch von Hays (1963, 1994), auf das 
ich regelmaBig verweisen werde. Auf Bortz (1999) werde ich haufig hinweisen, weil es 
an deutschsprachigen Universitaten sehr weit verbreitet ist. Weitere Lehrbticher findet 
man in den Fachbibliotheken. 

Praktisch durchgeftihrt werden statistische Auswertungen meist am Arbeitsplatz- 
computer mit einem der statistischen Analysesysteme. Gelegentlich werde ich auf das 
haufig benutzte SPSS (Versionen 8 bis 10) hinweisen, um moglichen Benutzern die 
Arbeit und insbesondere den Umgang mit programmspezifischen Eigentumlichkeiten zu 
erleichtern. Beschreibungen des Programms sind in vielen Handbtichern zu finden (z.B. 
Buhl & Zofel, 2000; Janssen & Laatz, 1999; SPSS Inc., 1999). 

3 z.B. Fisz (1970), Rasch (1995) 

4 Die zweite dieser Vorlesungen enthalt auBerdem eine Einfiihrung in die Grundlagen des 
Messens, Testens und Skalierens, die in diesem Buch nur ganz knapp behandelt werden. 

5 vgl. die sog. PQ4R-Methode zur Elaboration von Texten (Anderson, 1996a, S. 189-193) 
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schnitte. Derartige Auflockerungen verlieren spatestens dann ihren Reiz, wenn man - 
was ich sehr hoffe - haufiger auf diesen Text zuriickgreift. 

• • 

Als hilfreich fur das Verstandnis gerade abstrakter Texte und Uberlegungen haben 

sich immer wieder konkrete Beispiele erwiesen. Ich habe mich deshalb bemiiht, 

• • 

meine Darstellungen und Uberlegungen durchgangig durch geeignete Beispiele aus 
der Psychologie zu verdeutlichen. 6 Die Wahl der Beispiele ist natiirlich durch meine 
inhaltlichen Vorkenntnisse und Interessen bestimmt. Fur einige Leser mogen deshalb 
einige der Beispiele schwerer verstandlich sein als fur andere. 

Hinweise auf Literatur gebe ich in diesem Buch in FuBnoten und nicht, wie in der 
Psychologie iiblich, in Klammern im fortlaufenden Text. Dadurch soli die Lesbarkeit 
des Textes erhoht werden. In FuBnoten finden sich auch Zusatze zum Haupttext, die 
fur die erste Einarbeitung von geringerer Bedeutung sind, fur eine intensivere 
Beschaftigung mit dem Stoff aber wichtige Erganzungen, Prazisierungen oder 
Verweise bereitstellen. Ich hoffe, dass dadurch die Trennung zwischen besonders 
und weniger Wichtigem erleichtert wird. 

Verschiedene vorangegangene Versionen und Teile dieses Textes habe ich bereits 
als Grundlage fur Vorlesungen und begleitende Tutorien zur Methodenlehre der 
Psychologie verwendet. Dabei haben mir Katja Antoniw, Niko Busch, Ulf Gaus- 
mann, Kati Klimas, Annett Proger und Maike de Wall wertvolle Rtickmeldungen 
gegeben. Wichtige Hinweise verdanke ich auch Gotz Gelbrich, Anette Hiemisch, 
Maria Kolyschkow und Elke Liitkemeier. Besonders profitiert habe ich von den zahl- 
reichen Anmerkungen von Willi Hager und Matthias Siemer. Evelyn Reichel hat mir 
nicht nur bei der Erfassung der Literatur und der Erstellung des Textes und der 
Indizes geholfen, sondern mich auch stark von anderen Aufgaben entlastet. 

Da ich in der Druckfassung sicher noch etliche Mangel iibersehen habe, bin ich 
fur alle Hinweise, Kritiken und Anregungen auBerordentlich dankbar. 



Greifswald, im Mai 2000 



Rainer Westermann 
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1 Einleitung 



Das Studium an einer Universitat setzt nicht den allgemeinbildenden Schulunterricht 
in einem breiten Facherspektrum fort, es ist aber auch keine praktische Ausbildung 
zu einem bestimmten Beruf. Ein Universitatsstudium soil die Studierenden vielmehr 
zur wissenschaftlichen Arbeit befahigen und sie auf berufliche Tatigkeiten 
vorbereiten, die die Anwendung wissenschaftlicher Erkenntnisse und Methoden 
erfordern. 7 

Die Inhalte eines Universitatsstudiums unterscheiden sich deshalb deutlich von 
den moglichen spateren Tatigkeiten. So wird im Jurastudium nicht trainiert, fulmi- 
nante Verteidigungsreden zu halten, und das Diplom in Psychologie befahigt noch 
nicht zur erfolgreichen Psychotherapie. Das Universitatsstudium bietet vielmehr eine 
Ausbildung durch Wissenschaft. Durch Beschaftigung mit Methoden und Ergebnis- 
sen der Wissenschaft sollen grundlegende Qualifikationen fur spatere Berufstatigkei- 
ten erworben werden. 

Aber was ist Wissenschaft? In Lexika finden wir folgende Charakterisierungen: 

• „Gegenliber dem unabgesicherten, haufig subjektiven Meinen muss das wiss. 
Wissen - seinem Anspruch nach - begriindet werden, es muss in jeder kompetent 
und rational geflihrten Argumentation Zustimmung finden konnen“. 

• Wissenschaft „ist der Inbegriff des menschl. Wissens; das nach Prinzipien 
geordnete Ganze der Erkenntnis der sachlich geordnete Zusammenhang von 
wahren Urteilen, wahrscheinlichen Annahmen ... und moglichen Fragen ... Im 
Unterschied zum ungeordneten (Erfahrungs-)Wissen ... geht die Wissenschaft 
nicht bloB auf das Dass, sondern auch auf das Warum, die Grlinde, Ursachen ... 
der Dinge.“ 9 

• „Methodisch kennzeichnet die W. ein gesichertes, in einen Begriindungszusam- 
menhang von Satzen gestelltes und damit kommunizierbares und nachpriifbares 



§§ 2 und 7 Hochschulrahmengesetz, zuletzt geandert durch Gesetz vom 20.8.1998 
Meyers GroBes Taschenlexikon, 1983, Band 24, S. 171 
Schischkoff (1974, S. 715-716) 
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Wissen, das bestimmten wiss. Kriterien (z.B. Allgemeingiiltigkeit, Systematisier- 
barkeit) folgt“. 10 

Nach diesen Beschreibungen unterscheidet sich wissenschaftliches Wissen vom all- 

taglichen Wissen dadurch, dass es besser geordnet und begrtindet ist. Alltagswissen 

ist oft weder klar formuliert noch ausreichend iiberpriift. In den Wissenschaften fin- 

den sich demgegeniiber spezielle Methoden zur besseren Formulierung von (vermu- 

• • 

teten) Erkenntnissen und spezielle Methoden zur besseren Uberprufung dieser Hypo- 
thesen. Sich mit einer Wissenschaft vertraut zu machen, heiBt deshalb vor allem: sich 
mit ihren Methoden vertraut zu machen. 

Die Psychologie versteht sich als empirische Wissenschaft, die meisten Psycholo- 
gen sind Empiriker. Sie liberpriifen Hypothesen und Theorien nicht (nur) durch 
griindliche Uberlegungen oder heftige Diskussionen, sondern (auch) an gezielt aus- 
gewahlten Erfahrungsdaten: Antworten, Messungen, Testergebnisse usw. aus Beob- 
achtungen, Experimenten, Befragungen oder anderen systematischen Untersuchun- 
gen. 11 

Wissenschaftliche Erkenntnisse werden in Theorien, Annahmen, Gesetzen usw. 

12 

formuliert. Diese Begriffe kann man wie folgt kennzeichnen: 

• Als Annahme oder Postulat bezeichnet man eine Aussage, deren Gliltigkeit oder 

Wahrheit man nicht speziell iiberpruft, die man aber voraussetzt, um weiter- 
• • 

gehende Uberlegungen oder Untersuchungen anstellen zu konnen. 

• Eine Hypothese ist eine Aussage, von der man erwartet, dass sie sich bei einer 
spateren empirischen Priifung als zutreffend zeigen wird. 

• Von einem Gesetz wird meist dann gesprochen, wenn eine Aussage liber einen 
Ursache-Wirkungs-Zusammenhang vorliegt, die empirisch gut bestatigt ist. 

• Theorien umfassen in der Regel mehrere zusammenhangende Gesetze. 

• Als Modelle werden haufig anschauliche Vorstellungen liber (psychologische) 
Strukturen, Zusammenhange oder Ablaufe bezeichnet. 



1.1 Methoden im Psychologiestudium 

Die Lehre von den Methoden zur systematischen Gewinnung, Formulierung und Ab- 
sicherung wissenschaftlicher Erkenntnisse bezeichnen wir als Forschungs-methodik. 
Im ersten Abschnitt des Diplomstudiengangs ist Methodenlehre seit langem Pflicht- 
fach. An alien Studienorten gehoren dazu scheinpflichtige Veranstaltungen zur Sta- 



Brockhaus Enzyklopadie, 1994, Band 24, S. 277 

Die Mathematik dagegen ist eine nicht-empirische, formale oder Vernunftwissenschaft, 
in der Befunde allein durch Nachdenken gewonnen und iiberpriift werden. 

Regenbogen & Meyer (1998), Speck (1980), Valentine (1991, S. 101). Genauere und 
z.T. abweichende Erlauterungen erfolgen spater. 



12 





Einleitung 



19 



tistik. Dariiber hinaus gibt es unterschiedliche Pflicht- und Wahlveranstaltungen, z.B. 

1 3 

zu Versuchsplanung, Skalierung und Wissenschaftstheorie. 

Einzelne Forschungsmethoden werden auch in anderen Teilfachern behandelt, 
z.B. Computersimulation in der Kognitionspsychologie, Lebenslauf analyse in der 
Entwicklungspsychologie und Faktorenanalyse in der Personlichkeitspsychologie. 

Seit 1985 sehen Rahmenprtifungs- und -studienordnungen eine weitere Metho- 
denausbildung nach der Vorpriifung im Fach Evaluation und Forschungsmethodik 
vor. Es wird ortlich sehr unterschiedlich ausgestaltet. Zum einen gibt es verschieden- 
artige Verfahren zur Evaluation von Institutionen und MaBnahmen. Zum anderen 
werden unterschiedliche Forschungsmethoden vom Interview bis zur multivariaten 
Statistik behandelt. 

Zu den Methoden der Psychologie gehoren auch diagnostische Methoden (Anam- 
nese, Exploration und Tests), Beratungs- und Interventionsmethoden sowie therapeu- 
tischen Methoden. Diese anwendungsorientierten Methoden werden in den Fachern 
Diagnostik, Intervention und Klinische Psychologie gelehrt, teilweise auch in der 
Padagogischen Psychologie und der Arbeits- und Organisationspsychologie . 

Forschungsmethoden sind fur ein wissenschaftliches Studium von hoher Bedeu- 
tung. Durch Aneignung der Methoden zur wissenschaftlichen Erkenntnisgewinnung 
soil es Universitatsabsolventen moglich sein, auch Probleme zu losen und Aufgaben 
zu erftillen, die erst wahrend ihres Berufslebens auftreten und zur Zeit ihres Studium 
noch unbekannt waren. Die Beschaftigung mit der Forschungsmethodik versetzt sie 
in die Lage, fachliche Befunde, Auffassungen und Theorien kritisch zu bewerten, sie 
auf ihre wissenschaftliche Fundierung hin zu prlifen und sich der Vorlaufigkeit und 
Unvollkommenheit aller wissenschaftlicher Erkenntnisse bewusst zu sein. 



1.2 Aspekte der Forschungsmethodik 

Die Psychologische Forschungsmethodik umfasst fachiibergreifende wissenschafts- 
theoretische Inhalte sowie spezifische Methoden, Methodiken und Methodologien. 15 

• Methoden sind konkrete Verfahrensweisen, die in der Forschung angewendet 
werden, um bestimmte Ziele zu erreichen (Kapitel 1.3 enthalt einige Beispiele). 

0 In der Psychologie haben wir bestimmte Methoden zur Durchfiihrung randomisierter 
Experimente, zur Konstruktion standardisierter Tests, zur varianzanalytischen 
Auswertung von Daten, zur Interpretation von Interviewantworten usw. 

• Die Lehre von den allgemeineren Prinzipien einer bestimmten Klasse von 
Methoden bezeichnen wir als Methodik. 



13 

Diese Themenbereiche und Veranstaltungen werden explizit in den derzeit giiltigen 
Empfehlungen der Studienreformkommission Psychologie aus dem Jahr 1985 genannt. 

14 Moosbrugger, Rost & Schermelleh-Engel (1999) 

15 nach Sprung & Sprung (1987, S. 28), von anderen Autoren teilweise in anderer 
Bedeutung verwendet (Herrmann, 1984, S. 32-33; Traxel, 1974, S. 19). 
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0 In der Psychologie haben wir beispielsweise eine Beobachtungsmethodik, eine 
Befragungsmethodik, eine Testmethodik und eine Experimentalmethodik. 

Der zweite Teil des Buches beschaftigt sich ausfiihrlich mit der Experimental- 
methodik, andere Methodiken konnen nicht dargestellt werden. 16 

• Fachspezifische Methodologien sind die tiber die einzelnen Methodenklassen 
hinausgehenden Prinzipien der fachwissenschaftlichen Erkenntnisgewinnung, d.h. 
der Aufstellung, Uberprlifung und Veranderung psychologischen Theorien und 
Hypothesen aufgrund empirischer Daten. 

0 Kennzeichnend fur die psychologische Forschung sind die hypothetico-deduktiven und 
die signifikanzstatistischen Methodologien: Psychologische Hypothesen und Theorien 
werden in der Regel iiberpriift, indem Vorhersagen aus ihnen abgeleitet und diese mit 

17 

den Ergebnissen von Signifikanztests verglichen werden. 

Die Methodologien der psychologischen Forschung beruhen meist auf fachiiber- 

greifenden Methodologien, die in der Wissenschaftstheorie analysiert werden. 

Die Wissenschaftstheorie ist eine Metawissenschaft. Ihr Gegenstandsbereich sind 

die Prinzipien, Ziele, Wege und Ergebnisse der einzelnen Real- oder Substanz- 

wissenschaften. Lange Zeit wurde in der Wissenschaftstheorie vor allem die Physik 

analysiert, seit einigen Jahrzehnten werden aber auch andere empirische Wissen- 

• • 

schaften starker betrachtet, vor allem Biologie, Psychologie und Okonomie. 

Der Gegenstandsbereich der Wissenschaftstheorie umfasst drei Bereiche: 

• Fachiibergreifende Methodologien beschaftigen sich mit allgemeinen Verfahrens- 
weisen zur Gewinnung wissenschaftlicher Erkenntnisse 

0 Die Falsifikationsmethodologie von Popper strebt Erkenntnisfortschritt durch strenge 
Uberprlifung und gezielte Verbesserung der Theorien an. 

• Epistemologien (Erkenntnistheorien) beschaftigen sich mit den Moglichkeiten, 
Bedingungen und Grenzen der menschlichen Erkenntnis im Allgemeinen und der 
substanzwissenschaftlichen Erkenntnis im Besonderen. 

0 Empiristen sehen in der Sinneserfahrung die Hauptquelle der Erkenntnis, wahrend 
Rationalisten die entscheidende Rolle des Verstandes betonen (siehe Kapitel 2.1.1). 

• Metatheorien beschreiben Aufbau und Struktur substanzwissenschaftlicher 
Theorien, Begriffe und Annahmen. 

0 Durch die strukturalistische Theorienkonzeption wird eine psychologische Theorie als 
Netz von Theorie-Elementen dargestellt (siehe Kapitel 11). 

Im ersten Teil dieses Buches werden epistemologische, methodologische und meta- 
theoretische Grundlagen der Psychologie besprochen. Sie werden allerdings von 



16 Lehr- und Handbiicher: Bredenkamp & Feger (1983), Bortz & Doring (1995), Erdfelder, 
Mausfeld, Meiser & Rudinger (1996), Friedrichs (1985), Kerlinger (1978, 1979), Lewin 
(1986), Rogge (1995), Roth (1984), Selg, Klapproth & Kamenz (1992), Sprung & 
Sprung (1987), Traxel (1974) 
siehe Kapitel 10.2 und 15 
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verschiedenen Wissenschaftstheoretikern ganz unterschiedlich beschrieben und ana- 
lysiert. Einige dieser Divergenzen werde ich darstellen und deutlich machen, dass es 
auch auf methodische Fragen meist nicht nur eine richtige Antwort gibt. 

Ich werde aber auch versuchen, die nach meiner Meinung besten Sichtweisen her- 
auszustellen. Gepragt werden meine Positionen zum einen durch die Methodologie 
des Kritischen Rationalismus von Karl Popper. Zum anderen beruhen sie ganz 
wesentlich auf der strukturalistischen Wissenschaftstheorie. Sie ist unter anderem 
von John Sneed und Wolfgang Stegmtiller in der Tradition der Analytischen Philo- 
sophic und des Logischen Empirismus entwickelt worden. 19 

Wissenschaftstheoretische Richtungen unterscheiden sich darin, ob sie eher nor- 
mativ oder eher deskriptiv vorgehen. Bis zur Mitte des 20. Jahrhunderts uberwogen 
normative Ansatze. Der Kritische Rationalismus etwa enthalt eindeutige 
Forderungen, wie Wissenschaftler ihre Theorien priifen und verbessern sollen. Den 
Nutzen deskriptiver Ansatze hat vor allem Thomas Kuhn mit seiner Beschreibung 
erfolgreicher Paradigmen und Revolutionen demonstriert. In der strukturalistischen 
Wissenschaftstheorie werden deskriptive und normative Aspekte verbunden, indem 
man wissenschaftliche Prozesse und Produkte rekonstruiert, d.h. sie einheitlicher, 
systematischer und praziser darstellt. 

Die deskriptiven Ansatze der Wissenschaftstheorie sind eng mit anderen meta- 
wissenschaftlichen Disziplinen verbunden: 

• Die Wissenschaftsgeschichte beschreibt Entstehung und Veranderung wichtiger 

90 

Theorien, Vorgeschichte und Ablauf bahnbrechender Entdeckungen usf. 

• In der Wissenschaftssoziologie werden gesellschaftliche Einflusse auf die 

2 1 

Wissenschaften und sozialen Prozesse innerhalb der Wissenschaften untersucht. 



1 8 

In diesem Buch werden wichtige Aspekte des Kritischen Rationalismus insbesondere in 
den Kapiteln 9.2 und 10.2 dargestellt (vgl. Westermann, 1987c, Abschn. 2.3). Zur 
weiteren Einarbeitung zu empfehlen sind eine Autobiographic (Popper, 1979) und eine 
ausgezeichnete Textzusammenstellung (Popper & Miller, 1997). 

19 Zur ausflihrlicheren Darstellung der strukturalistischen Konzeption siehe Kapitel 11.2 
bis 11.9 (zusammenfassend: Westermann, 1987c, Abschn. 2.6). Unter die analytische 
Philosophic ordnet man unterschiedliche Richtungen der Philosophic und Wissen- 
schaftstheorie des 20. Jahrhunderts ein, die auf logischen Analysen der Sprache 
beruhen. Dazu gehoren sowohl die Analyse der normalen Sprache (z.B. von Ludwig 
Wittgenstein) als auch die Analyse und Verbesserung der Wissenschaftssprachen, die 
von den Logischen Empiristen (z.B. Rudolf Carnap) verfolgt wurde. Zur Einfuhrung: 
Carnap (1986, 1993), Stegmliller (1969, Kap. IX und X), Westmeyer (1977), 
Westermann (1987c, Abschn. 2.2) sowie unten Kapitel 4.3.1, 9.1, 11.1. 

90 

Kuhn (1977a), Lakatos (1974a), Psychologiegeschichte: Benjamin (1992), Brauns & 
Schmitz (1989), Luck (1996), Madsen (1988), meta-wissenschaftliche Analyse der 
Motivationspsychologie: Madsen (1974) 

21 Seiffert & Randnitzky (1989, S. 453-461), Balzer (1997, S. 1 1-47), MittelstraB (1996, S. 
733-737) 
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• Die Wissenschaftspsychologie untersucht beispielsweise die motivationalen und 

22 

kognitiven Prozesse, die zu wissenschaftlichen Entdeckungen fuhren. 



• • 

1.3 Psychologische Forschungsmethoden: Uberblick und Beispiele 

Gegenstand der Psychologischen Methodenlehre sind, wie wir gesehen haben, nicht 
alle Methoden der Psychologie, sondern die Methoden der psychologischen For- 
schung: Wie geht psychologische Forschung vor? Wie kann sie vorgehen? Wie sollte 
sie vorgehen? Auf diese Fragen konnen keine einfachen Antworten gegeben werden, 
denn in der Psychologie findet sich ein breites Spektrum von Forschungsmethoden. 
Einige besonders wichtige sollen zur Einfiihrung jeweils kurz charakterisiert und mit 
einem bekannten Lehrbuchbeispiel illustriert werden. 

1.3.1 Untersuchungsmethoden 

In diesem Kapitel betrachten wir Methoden zur Gestaltung der Untersuchungs- 
situation, im nachsten Methoden zur Erhebung der interessierenden Informationen. 

Kontrollierte Laboruntersuchungen 

In kontrollierten Faboruntersuchungen untersucht man Phanomene in gezielt gestal- 
teten Situationen. Betrachtet wird dabei der Zusammenhang zwischen mindestens 
einer unabhangigen Variablen (UV) und mindestens einer abhangigen Variablen 
(AV). Im einfachsten Fall wird gepruft, ob eine Veranderung der UV eine Veran- 
derung der AV nach sich zieht. Um die Veranderung der UV als Ursache der Veran- 
derung der AV bezeichnen zu konnen, muss der mogliche Einfluss anderer Faktoren 

no 

ausgeschaltet oder konstant gehalten werden. Unberticksichtigt bleiben alle 
Aspekte der Untersuchungssituation und der Untersuchungseinheiten, die flir die 
gegenwartig interessierende Fragestellung nicht relevant zu sein scheinen. 

0 Edward Thorndike entwickelte spezielle Problemkafige, aus denen heraus ein 
Untersuchungstier mit einer bestimmten Reaktion (z.B. Ziehen an einer Schlaufe) zum 
Futter gelangen kann. Wird ein Tier mehrfach in die gleiche Situation gebracht, nimmt 
die Zeit bis zur Ausfuhrung der richtigen Reaktion (dies ist die AV) mit steigender 
Anzahl der Versuchsdurchgange oder trials (dies ist die UV) tendenziell ab. Werden die 
Reaktionszeiten mehrerer Tiere gemittelt, ergeben sich liber die Versuchsdurchgange 



99 

Einfuhrungen und Ubersichten: Brandtstadter & Reinert (1973), Hiebsch (1977), Klahr 
& Simon (1999); zur kognitionspsychologischen Simulation von Entdeckungsprozessen: 
Langley, Simon, Bradshaw & Zytkow (1987), Reimann (1990); zur wissenschaftlichen 
Kreativitat: Simonton (1989); zur Beurteilung wissenschaftlicher Leistungen: Montada, 
Krampen & Burkard (1999) 

23 siehe Kapitel 14.2 
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stetig abfallende Lernkurven. Als moglicher weiterer Einflussfaktor konstant gehalten 
wird z.B. die Zeit seit der letzten Nahrungsaufnahme, ausgeschlossen wird unter anderem 
die Ablenkung durch andere Tiere oder Anreize. Alle anderen mutmaBlich irrelevanten 
Aspekte (z.B. die lautlichen AuBerungen der Tiere) bleiben unberiicksichtigt. 

Laborexperimente 

Wie bei kontrollierten Laboruntersuchungen wird eine kiinstliche und in alien 
wesentlichen Aspekten kontrollierbare Situation hergestellt, um die interessierenden 
Phanomene moglichst isoliert und unbeeinflusst untersuchen zu konnen. Der 
wesentliche Unterschied zwischen Laborexperimenten und kontrollierten Labor- 
untersuchungen besteht darin, dass bei Experimenten mindestens zwei Unter- 
suchungsbedingungen verglichen werden, die sich ausschlieBlich hinsichtlich der 
interessierenden Einflussfaktoren unterscheiden sollen. Dazu muss eine Rando- 
misierung durchgefuhrt werden: Die Untersuchungspersonen oder -tiere einerseits 
und die Untersuchungsbedingungen oder -reihenfolgen andererseits mtissen einander 
zufallig zugeordnet werden. 

0 Albert Bandura lieB vier- bis fimfjahrige Kinder einen Film anschauen, in dem ein 
Erwachsener eine Plastikpuppe beschimpft und misshandelt. Die Kinder wurden zufallig 
einer von drei Experimentalgruppen zugeordnet, die sich durch den Abschluss des Films 
unterschieden: das aggressive Verhalten wurde belohnt, bestraft oder blieb folgenlos 
(UV). Beim anschlieBenden Spiel mit der Puppe war die Anzahl der Nachahmungs- 
reaktionen (AV) im Mittel bei den Kindern geringer, die die „stellvertretende Bestrafung“ 
gesehen hatten. 26 

Feldexperimente 

Feldexperimente sind Experimente, die unter moglichst naturlichen und alltaglichen 
Umstanden durchgefuhrt werden. Mitunter konnen diese so gestaltet werden, dass 
die Personen gar nicht bemerken, dass sie Teilnehmer an einer Untersuchung sind. 

0 Kurt Lewin und Kollegen setzten in vier Freizeitgruppen flir 10-jahrige Jungen trainierte 
Betreuer ein, durch die jede Gruppe in unterschiedlicher Reihenfolge autoritare, 
demokratische und Laissez-faire - Fuhrung erlebte. Insgesamt zeigten sich bei Laissez- 

27 

faire die schlechtesten, bei demokratischer Fuhrung die besten Arbeitsergebnisse. 
Quasi-Exp erimente 

In einem Quasi-Experiment werden zwei oder mehr Gruppen verglichen, die nicht 
durch eine Zufallszuordnung zustande gekommen sind, bei denen aber versucht 
wird, andere mogliche Einflussfaktoren konstant zu halten: durch eine gezielte 



Bower & Hilgard (1983, S. 42-45) 

25 siehe dazu ausftihrlich Kapitel 14.3 

26 Halisch (1990, S. 375-376) 

27 Zimbardo (1992, S. 586) 
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Zusammenstellung ahnlicher Gruppen ( Parallelisierung ) oder durch ein statistisches 
„Herausrechnen“ von Gruppenunterschieden ( Auspartialisierung ). 

0 L.L. Heston verglich die Entwicklung von 47 Kindern schizophrener Mutter, die un- 
mittelbar nach der Geburt in Heime kamen, mit 50 anderen Kindern aus den gleichen 
Heimen, die ihnen hinsichtlich des Geschlechts, der Dauer des Heimaufenthalts und der 
Art der spateren Adoptivfamilie so ahnlich wie moglich waren. Bei den Kindern der 
schizophrenen Mutter zeigten sich erheblich hohere Erkrankungshaufigkeiten. Dies wird 
als Hinweis auf die Bedeutung genetischer Faktoren interpretiert. 29 

Vergleiche vorgegebener Gruppen 

Es wird eine unabhangige Variable betrachtet, deren Auspragungen bei den Personen 
vorgegeben sind. Die Personen konnen in die Untersuchungsgruppen klassifiziert, 
ihnen aber nicht zufallig zugeordnet werden. Eine Parallelisierung nach anderen 
relevanten Variablen ist meist nicht sinnvoll, weil dann mindestens eine 
Untersuchungsgruppe systematisch von der entsprechenden Bevolkerungsgruppe 
abweicht. 

0 Maccoby und Jacklin haben empirische Untersuchungen zusammengefasst, die jeweils 
Manner und Frauen hinsichtlich der (mittleren) Auspragung verschiedener Variablen 
vergleichen. Die deutlichsten Gruppenunterschiede finden sich hinsichtlich der Aggres- 
sivitat: Manner sind im Mittel eindeutig aggressiver als Frauen. Bei den kognitiven 

Leistungen sind Frauen bei verbalen Aufgaben im Mittel leicht uberlegen, Manner ebenso 

30 

leicht bei raumlichen und quantitativen Aufgaben. 

Korrelationsstudien 

In Korrelationsstudien werden die Zusammenhange zwischen verschiedenen Varia- 
blen innerhalb einer Untersuchungsgruppe von Personen festgestellt, ohne dass der 
Einfluss anderer Variablen konstant gehalten oder ausgeschaltet wird. 

0 Erfasst man die Auspragung des Leistungsmotivs bei verschiedenen Schulern durch einen 
geeigneten Fragebogen oder Test, ergibt sich nur eine geringe Korrelation mit ihren 
mittleren Schulnoten. Teilt man die Schuler gemaB ihrer Motivauspragung in zwei 
Gruppen ein, bedeutet dies: Uberdurchschnittlich leistungsmotivierte Schuler haben keine 
besseren Schulnoten als unterdurchschnittlich leistungsmotivierte Schuler. 31 



28 Cook & Campbell (1979), Cook, Campbell & Peracchio (1990), zur Auspartialisierung 
durch Kovarianz- oder Regressionsanalysen: Cohen & Cohen (1983), Tabachnik & 
Fidell (1996) 

29 Davison & Neale (1996, S. 465-466) 

30 Saks & Krupat (1988, S. 140-141) 

31 Weiner (1988, S. 151). Wie dieses Beispiel veranschaulicht, ist jeder Vergleich 
vorgegebener Gruppen gleichbedeutend mit einer Korrelationsstudie, auch wenn meist 
keine Korrelationen im statistischen Sinne berechnet und getestet werden, sondern 
Mittelwertsdifferenzen (siehe unten Kapitel 15.4.2). 
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Evaluationsuntersuchungen 

Evaluationen sind wissenschaftliche Untersuchungen zum Erfolg oder zur Effektivi- 

TO 

tat von Institutionen, MaBnahmen, Techniken oder Vorgehensweisen. 

0 Als in den siebziger Jahren in der Bundesrepublik Deutschland zunachst versuchsweise 

Gesamtschulen anstelle des dreigliedrigen Schulsystems eingefuhrt wurden, wurden 

33 

Leistungen und soziales Klima in beiden Schulsystemen systematisch verglichen. 

Meta-Analysen 

In Meta-Analysen werden die Ergebnisse verschiedener Untersuchungen zusammen- 
gefasst, die zu einer bestimmten Fragestellung durchgeftihrt worden sind . 34 

0 Um zu untersuchen, ob die damaligen Zweifel an der Effektivitat von Psychotherapien 
berechtigt waren, haben Mary Smith und Gene Glass 1977 die Ergebnisse von 375 
wissenschaftlichen Untersuchungen meta-analysiert, die jeweils mindestens eine Gruppe 
von behandelten Personen mit einer Kontrollgruppe verglichen haben. Insgesamt hatten 
die psychotherapeutischen MaBnahmen einen positiven und mittelgroBen Effekt. Am 
groBten waren die Effekte von systematischen Desensibilisierungen zur Angstreduktion, 
am kleinsten die Wirkungen von Gestalttherapien. 

Langsschnittstudien 

In Langsschnittstudien werden die gleichen Personen mehrmals oder sogar sehr 
haufig auf annahernd die gleiche Weise befragt, beobachtet oder getestet. 

0 Lewis Terman identifizierte kurz nach dem ersten Weltkrieg in Kalifornien liber 1500 
hochintelligente Kinder. Er testete und befragte sie in regelmaBigen Abstanden liber 60 

Jahre hinweg, um ihre intellektuelle Entwicklung und ihre Lebensbewaltigung zu 

37 

verfolgen. 

1.3.2 Erhebungsmethoden 

Nach den Methoden zur Gestaltung der Untersuchungssituation betrachten wir im 
folgenden einige wichtige Methoden zur Datenerhebung. 



Nachreiner, Muller & Ernst (1987), Chen (1990), Shadish, Cook & Levi ton (1991), 
Wottawa & Thierau (1998), Rossi, Freeman & Lipsey (1999), Hager, Patry & Brezing 
( 2000 ) 

Rost (1998, S. 454-459) 

Fricke & Treinies (1985), Hedges & Olkin (1985), Rosenthal (1991) 

Smith & Glass (1977) 

von Eye (1990a, 1990b), Magnusson, Bergman, Rudinger & Torestad (1991) 

Zimbardo (1995, S. 56) 
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Beobachtu ngen 

Eine wissenschaftliche Beobachtung muss systematisch und kontrolliert erfolgen: Es 
ist vorab moglichst genau festzulegen, wer, was, wann und bei wem beobachten soil 
und wie dabei mogliche Fehler und Storeinflusse vermieden werden. 38 

0 L.A. Petitto und P.F. Marentette filmten das Verhalten von fiinf etwa einjahrigen 
Kindern. Zwei von ihnen waren horgeschadigte Kinder, deren horgeschadigte Eltern die 
„Gebardensprache“ benutzten. Die Videoaufnahmen wurden nach alien Arten von 
verbalen und manuellen Aktivitaten kodiert. Dabei zeigte sich, dass die Handbewegungen 
der horgeschadigten Kinder iiberwiegend aus verschiedenen identifizierbaren Gesten 
bestehen, die als „manuelles Plappern“ interpretiert werden konnen. 

Tests und Skalierungen 

Bei psychologischen Tests lasst man Personen festgelegte Leistungsaufgaben oder 
personliche Fragen beantworten, um die individuellen Auspragungen von Fahigkeits- 
oder Personlichkeitsmerkmalen festzustellen. Bei einer Skalierung oder Beurtei- 
lung dienen die Antworten der Personen dazu, die Auspragung von Merkmalen bei 
anderen Personen oder Objekten zu bestimmen. 41 Die einzelnen Items von Fremd- 

42 

und Selbstbeurteilungen werden meist zu einem Fragebogen zusammengefasst. 

0 T.H. Holmes und R.H. Rahe haben eine groBere Zahl von Probanden gebeten, flir 
verschiedene mogliche kritische Lebensereignisse (Umzug, Heirat, Scheidung, usw.) 
jeweils das personlich empfundene AusmaB an Belastung (Stress) durch Zuordnung einer 
Zahl anzugeben. Die gemittelten Antworten ( Skalenwerte ) drucken ein Merkmal 
kritischer Lebensereignisse aus: das AusmaB an Belastung, das mit ihnen jeweils 

verbunden ist. Es kann dann beispielsweise untersucht werden, ob belastendere 

43 

Ereignisse eher den Ausbrach bestimmter Krankheiten nach sich ziehen. 

Werden die Personen gebeten anzugeben, welchen der Belastungen sie ausgesetzt 
waren, kann durch eine Addition der entsprechenden Skalenwerte fur jede Person ein 
Testwert flir die individuelle Belastung ermittelt werden. 

Befragungen 

Bei Befragungen oder Interviews konnen die Auskunft gebenden Personen relativ 
selbstandig liber Inhalt, Lange und sprachliche Form ihrer Antwort entscheiden. 44 



Cranach & Frenz (1969), Feger (1983), Grewe & Wentura (1991) 

Zimbardo (1992, S. 155-156) 

Ghiselli, Campbell & Zedeck (1981), Cronbach (1984), Kline (1986), Guthke, Bottcher 
& Sprung (1990), Steyer & Eid (1993), Lienert & Raatz (1998), Brickenkamp (1997) 
Torgerson (1960), Sixtl (1982), Roth (1984), Friedrichs (1985), Bortz & Doring (1995) 
Trankle (1983), Foddy (1994), Mummendey (1995) 

Davison & Neale (1996, S. 213-215) 

Schwarzer (1983), Sudman, Bradburn & Schwarz (1996), Konrad (1999) 
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0 F. Herzberg und Kollegen lieBen Arbeitnehmer die Faktoren angeben, die fur sie bei der 
Austibung ihrer taglichen Arbeit wichtig waren. Dabei nannten Zufriedene hauptsachlich 
Merkmale der Arbeitsleistung, Arbeitsinhalte und Selbstverwirklichung („Motivations- 
faktoren 44 ), wahrend unzufriedene Arbeitnehmer hauptsachlich auf schlechte Arbeits- 
bedingungen verwiesen („Hygienefaktoren 44 ) 45 

Physiologische Messungen 

Physiologische Messungen, also z.B. Messungen von Hautwiderstand, Blutdruck, 
Augenbewegungen oder Gehirnaktivitaten werden in kontrollierten Laborunter- 
suchungen, mit Hilfe von tragbaren Geraten aber teilweise auch wahrend alltaglicher 
Lebensablaufe erhoben. Je nach Fragestellung sind sie entweder selbst von Interesse 
oder dienen als Indikatoren ftir psychische Prozesse . 46 

0 M.I. Posner und Mitarbeiter zeigten mit Hilfe einer Positronen-Emissions-Tomographie 
(PET), dass wahrend der Verarbeitung sprachlicher und bildlicher Informationen 
unterschiedliche Gehirnregionen starker durchblutet werden. Dadurch wird die 
psychologische Theorie der getrennten verbalen und bildlichen Kodierung physiologisch 
gesttitzt. 47 

Inhaltsanalysen 

Akten- und Inhaltsanalysen extrahieren Informationen aus schriftlichen Quellen. Die 
Auswertungsmethoden konnen dabei vom Auszahlen formaler Merkmale bis zur 
Interpretation der Inhalte oder Absichten reichen . 48 

0 David McClelland untersuchte den Zusammenhang zwischen der Starke des Leistungs- 
motivs in verschiedenen Gesellschaften und ihrer okonomischen Entwicklung. Zur 
Bestimmung der Auspragung des Leistungsmotivs in zurtickliegenden Perioden (z.B. der 
griechischen Antike) wertete er zeitgenossische Dokumente (z.B. Lesebiicher) mit Hilfe 
eines Kategorienschemas nach leistungsbezogenen Inhalten aus. 49 

Simulationen 

In Simulationsuntersuchungen werden mit Computerprogrammen bestimmte 
Aspekte des Aufbaus und der Funktion von psychischen Prozessen nachgebildet . 50 

0 Der Erwerb von Begriffen und die Ableitung von GesetzmaBigkeiten aus Beispielen 
werden psychologisch als Verstarkung, Differenzierung und Generalisierung von Wenn- 
dann-Regeln ( Produktionen ) erklart. P. Langley und andere Autoren haben Computer- 



Weinert (1987, S. 106-107) 

46 Birbaumer & Schmidt (1999) 

47 Anderson (1996a, S. 106) 

48 Lisch & Kriz (1978), Bos & Tarnai (1989), Groeben & Rustemeyer (1994) 

49 Weiner (1988, S. 170) 

50 Loftus (1993), Opwis & Spada (1994), zur Simulation komplexerer nicht-linearer oder 
selbst-organisierender Prozesse: Barton (1994) 
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programme geschrieben, deren Leistungen mit den Ablaufen und Ergebnissen 
menschlicher Problembearbeitung verglichen werden konnen. 51 

Kombinationen 

Die angesprochenen Forschungsmethoden konnen in einzelnen Untersuchungen in 
vielfaltiger Weise kombiniert werden: 

• Bei jeder der verschiedenen Untersuchungsmethoden (Experiment, Quasi- 
Experiment usw.) kann im Prinzip jede der verschiedenen Erhebungsmethoden 
(Beobachtungen, Testungen, physiologische Messungen usw.) eingesetzt werden. 

• In einer bestimmten Untersuchung konnen verschiedene Erhebungsmethoden 
eingesetzt werden, um verschiedene Merkmale zu erfassen oder um das gleiche 
Merkmal auf verschiedene Weise zu erfassen. 

• In einer Untersuchung kann eine unabhangige Variable experimentell verandert 
werden, wahrend eine andere unabhangige Variable quasi-experimentell oder 
klassifikatorisch ist. 

0 In einem motivationspsychologischen Experiment mussten die Personen mit hoher 
und die Personen mit geringer Priifungsangst (UV mit vorgegebenen Gruppen) eine 
ganze Reihe von gleichartigen Intelligenztestaufgaben losen. Zwischendurch wird ihre 
Leistung unabhangig von ihrem tatsachlichen Wert bei einem zufallig bestimmten Teil 
der Personen als „Erfolg“, bei einem anderen Teil als „Misserfolg“ bewertet 
(experimentelle UV). Bei den Niedrigangstlichen ist die mittlere Losungszeit (AV) 
nach der Riickmeldung von Misserfolg geringer als nach Erfolg, bei den hoch 
Priifungsangstlichen zeigt sich kein wesentlicher Unterschied. 52 

Die vorangegangenen Beschreibungen konnen nur einen ersten Eindruck von 
wichtigen psychologischen Forschungsmethoden verschaffen. In den folgenden 
Kapiteln wenden wir uns den wissenschaftstheoretischen Grundlagen der mit diesen 
Methoden arbeitenden psychologischen Forschung zu. 



51 

52 



Liter & Spada (1990, S. 242-250) 
Heckhausen (1989, S. 224) 





2 Moglichkeiten und Grenzen der Erkenntnis 



2.1 Grundfragen der Erkenntnistheorie 

Die Erkenntnistheorie ( Epistemologie ) ist ein altes Teilgebiet der Philosophic. Seit 
der griechischen Antike beschaftigt sie sich mit Moglichkeiten, Bedingungen und 
Grenzen der Erkenntnis und des Wissens. Die Fragen „Wie ist Erkenntnis moglich“ 
und „Was konnen wir wissen?“ umreiBen ihren Gegenstandsbereich. 54 Im 20. 
Jahrhundert hat sich aus ihr die Wissenschaftstheorie entwickelt. 

2.1.1 Grundlegende erkenntnistheoretische Positionen 

Zur ersten Orientierung kann man vier grundsatzliche erkenntnistheoretische Posi- 
tionen unterscheiden, die sich jeweils paarweise gegentiberstehen. Realismus versus 
Idealismus und Rationalismus versus Empirismus. 

Realismus und Idealismus 

• Realistische Erkenntnistheorien nehmen an, dass es eine von uns unabhangige 
AuBenwelt gibt, die wir durch Wahrnehmung oder Denken erkennen konnen. 55 



Die folgenden Darstellungen zur Erkenntnistheorie beruhen auf Kunzmann, Burkard & 
Wiedmann (1991), MittelstraB (1995a, 1995b, 1995c, 1996), Regenbogen & Meyer 
(1998), Schischkoff (1974), Seiffert & Radnitzky (1989) und Speck (1980). Eine sehr 
gute Einfilhrung gibt Vollmer (1988). 

54 Im Unterschied zum Glauben und zur Meinung wird in der Philosophic von Erkenntnis 
oder Wissen nur dann gesprochen, wenn die Wahrheit des Erkenntnisinhalts relativ 
sicher ist und wenn diese Wahrheit begrtindet oder demonstriert werden kann. In der 
Psychologie fallen dagegen auch Vermutungen oder unsichere Meinungen unter den 
Begriff des Wissens (Strube et al., 1996, S. 799-815). 

55 In der mittelalterlichen Scholastik wurde als Realismus die Lehre von der Wirklichkeit 
der allgemeinen Ideen bezeichnet. Die Gegenrichtung, der Nominalismus , nahm an, dass 
allgemeine Begriffe nicht wirklich vorhanden sind, sondern nur bloBe Namen sind, die 
nur in unserem Intellekt existieren (Storig, 1999, S. 267-268). 
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- Strenge Realisten gehen davon aus, dass in der Erkenntnis die Eigenschaften 
und Beziehungen der Dinge vollstandig erfasst werden: Die Welt ist im 
Wesentlichen so, wie sie uns erscheint. 56 

- Viele Philosophen und Naturwissenschaftler der Gegenwart vertreten einen 
mehr oder minder kritischen Realismus : Unsere Wahrnehmungen und wissen- 
schaftlichen Erkenntnisse konnen sich der subjektunabhangigen AuBenwelt 
zwar annahern, entsprechen ihr aber nicht unbedingt vollstandig. 

• Fur idealistische Erkenntnistheorien gibt es nur eine geistige Wirklichkeit und die 

uns bekannten Dinge sind nichts anderes als Gebilde von Vorstellungen. 

- Einige radikale Idealisten leugnen die Existenz einer von uns unabhangigen 
AuBenwelt vollstandig. 

- Kritische Idealisten bestreiten nur, dass wir die AuBenwelt erkennen konnen. 58 

Rationalismus und Empirismus 

• Fur Empiristen ist die Sinneserfahrung die alleinige oder zumindest die wichtigste 

Quelle der Erkenntnis. Der Verstand kann diese ordnen und verallgemeinern. 59 

• Fur Rationalisten ist Form und Inhalt des Wissens primar im Verstand und in der 

fiO 

Vernunft begriindet, d.h. wir konnen die Wirklichkeit durch Denken erkennen. 

Erkenntnistheoretische Funktion von Theorien 

Wissenschaftliche Erkenntnisse werden vorzugsweise in Hypothesen, Modellen oder 

Theorien zusammengefasst. Eine Theorie besteht, allgemein und vorlaufig aus- 

gedrlickt, aus Verknupfungen zwischen Variablen (Ereignissen, Zustanden oder 



56 Realistische Abbild- oder Widerspiegelungstheorien wurden von Demokrit und Epikur 
sowie einigen Logischen Empiristen, Marxisten und Evolutionaren Erkenntnis- 
theoretikern vertreten. Letztere erklaren die Ubereinstimmung zwischen Abbild und 
Wirklichkeit durch die Anpassung der Erkenntnisstrukturen an die Umwelt (Riedl & 
Bonet, 1987; Riedl & Wuketis, 1987; Vollmer, 1988). 

57 

Ein Hauptvertreter des kritischen Realismus ist Nicolai Hartmann. Kritische realistische 
Positionen vertreten auch Albert (1980a), Boyd (1983), Gadenne (1984) und Laudan 
(1981). Eine Form des kritischen Realismus ist die Isomorphietheorie , die einige 
analytische und marxistische Philosophen vertreten: Erkenntnis besteht nicht in 
vollstandigen Abbildern, sondern in aktiv generierten Modellen, die strukturgleich 
(isomorph) mit der Realitat sind (zur Isomorphie siehe unten Kapitel 6.7). 

58 Idealistische Positionen wurden von den Philosophen Hume, Leibniz, Fichte, Hegel und 
Schopenhauer vertreten. George Berkeley ist ein radikaler Idealist. 

59 Klassische Empiristen sind die britischen Philosophen Bacon, Locke, Hume und Mill. 
Neo-Empiristen sind die Mitglieder des Wiener Kreises mit Carnap, Schlick, Neurath 
und Reichenbach. Man beachte: Personen, die ihre Hypothesen und Theorien an 
Erfahrungsdaten uberpriifen, werden als Empiriker bezeichnet (siehe oben Seite 18). Sie 
mussen aber keineswegs Empiristen , sondern konnen auch Rationalisten sein. 

60 Bekannte Rationalisten sind Platon, Descartes, Spinoza, Leibniz, Kant und Wolff. 
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Merkmalen), die zum Teil unbeobachtbare Konstrukte sind. Unerlasslich sind The- 
orien 

1. zur einheitlichen Beschreibung verschiedener Ereignisse und Beziehungen und 

2. zur Erklarung dieser beobachtbaren Phanomene durch wenige unbeobachtbare 
Konstrukte und gesetzmaBige Zusammenhange. 

AuBerdem dienen Theorien 

— zur Anregung von Forschung in neuen Phanomenbereichen, 

— zur Vorhersage von Ereignissen und 

— zur Anleitung zum erfolgversprechenden praktischen Handeln. 

Die Beziehung zwischen Theorien und Beobachtungen wird je nach erkenntnis- 
theoretischer Grundposition unterschiedlich gesehen: 

• Aus empiristischer Sicht sollte die Wissenschaft induktiv von den Beobachtungen 
zu den Theorien schreiten: Zunachst miissen die interessierenden Phanomene ge- 
nau beobachtet und gemessen werden. Erst danach kann versucht werden, die 
Resultate in Theorien zusammenzufassen. 

• Aus rationalistischer Sicht sollten Theorien deduktiv Iiberpriift werden: Da es 
keine Erfahrungen gibt, die frei von theoretischen Annahmen sind, miissen die 
Theorien den Untersuchungen immer vorangehen, sie anregen und ausrichten. 
Insbesondere sind aus den Theorien Vorhersagen abzuleiten und an den 
Untersuchungsergebnissen zu Iiberprufen. 

Etliche empiristisch ausgerichtete Psychologen sehen in der Sammlung von 
Beobachtungen und der Entwicklung von beschreibenden Theorien die 
Hauptaufgabe der Wissenschaft. Rationalisten streben dagegen erklarende Theorien 

rr\ 

an, die in nachfolgenden Experimenten uberpriift werden. 

Ebenfalls unterschiedlich gesehen wird die Beziehung zwischen wissenschaft- 
lichen Theorien und auBerwissenschaftlicher Realitat: 

• Fur Realisten ist eine wissenschaftliche Theorie zumindest ein Versuch, einen 
Aspekt der Wirklichkeit abzubilden. Die Begriffe sollen sich auf real existierende 
Sachverhalte beziehen und die Gesetze sollen tatsachlich bestehende Zusammen- 
hange beschreiben. 

• Fur Idealisten muss eine Theorie nicht unbedingt etwas tatsachlich Existierendes 
beschreiben, sie ist vielmehr Instrument zur Ableitung von Vorhersagen und 
(praktischen) Handlungsempfehlungen. Eine nicht-realistische Theorienauffas- 
sung wird deshalb haufig auch als Instrumentalismus bezeichnet. 



61 

62 



Genauere Kennzeichnungen erfolgen vor allem im Kapitel 1 1 . 
Mac Kay (1993) sowie ausfiihrlicher Kapitel 9. 
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Weitere erkenntnistheoretische Richtungen 

Etliche erkenntnistheoretische Positionen heben hervor, dass wissenschaftliche 
Ergebnisse nicht nur von Sinneserfahrung und Verstandeslogik abhangen, sondern 
auch von verschiedenen individuellen und sozialen Faktoren: 

• Pragmatiker messen den Wert wissenschaftlicher Befunde und Theorien vor 
allem an ihrem Nutzen fur die praktische Lebensflihrung, d.h. fur die Vorhersage 
von Ereignissen und die Steuerung des Verhaltens. AuBerdem betonen sie die 
Abhangigkeit der wissenschaftlichen Kriterien und Erkenntnisse von der jewie- 
ligen Situation und den beabsichtigten Verwendungen. 63 

• Konstruktivisten betonen die Abhangigkeit wissenschaftlicher Erkenntnisse von 
den aktiven Verarbeitungsprozessen der beteiligten Wissenschaftler, das heiBt von 
ihren individuellen Erfahrungen, Begrifflichkeiten und Motiven. 

• Konventionalisten betonen die Rolle von offenen Festlegungen und still- 
schweigenden Ubereinktinften der beteiligten Wissenschaftler. 

• Skeptiker leugnen entweder generell die Moglichkeit einer sicheren Erkenntnis 
oder sie bezweifeln zumindest, dass wir tiber die direkt wahrnehmbaren Sachver- 
halte hinaus sichere Erkenntnisse liber die Welt gewinnen konnen. 

Kombinierte erkenntnistheoretische Positionen 

Viele der in der Philosophic tatsachlich vertretenen erkenntnistheoretischen Auffas- 
sungen sind Abschwachungen und Zwischenformen der genannten Extremformen. 
Betrachten wir beispielsweise Karl Popper, einen der bedeutendsten Wissenschafts- 
philosophen des 20. Jahrhunderts. 

• Popper ist Rationalist: Fur ihn sind nicht die Beobachtungsdaten, sondern die 
Theorien das Primare in der Wissenschaft. Der Kern seines Kritischen Rationalis- 
mus besteht darin, dass Theorien nicht als wahr erwiesen ( verifiziert ) werden kon- 
nen. Sie mlissen aber streng an der Erfahrung iiberpriift werden, um als bewahrt 
gelten zu konnen. Bestehen sie diese Priifungen nicht, miissen sie verworfen 
( falsifiziert ) und durch bessere ersetzt werden. 66 

• Popper ist Realist: Wissenschaftliche Theorien sollen fiir ihn die AuBenwelt rich- 
tig beschreiben. In zweifacher Hinsicht ist er Kritischer Realist. Erstens sind wir 



63 

3 Entwickelt wurde der Pragmatismus Anfang des 20. Jahrhunderts, unter anderem durch 
den Psychologen William James (1994, Nachdruck). In der neueren Philosophic ver- 
treten Putnam (1997), Rorty (1996), Lenk (1975) und Stachowiak (1983a, 1995) 
pragmatische Positionen. Zum Verhaltnis zwischen Pragmatismus und kritischem 
Realismus siehe Gadenne (1998a). 

64 

zu verschiedenen Formen des Konventionalismus siehe MittelstraB (1995b, S. 462-465) 

65 Popper (1985, 1994) 

66 siehe dazu die spateren Kapitel 9.2 und 10.2 sowie zusammenfassend Westermann 
(1987c, Abschn. 2.3) 
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nach Popper nicht aufgrund unserer Wahrnehmung, sondern aufgrund unseres 
Verstandes in der Lage, die AuBenwelt zu erkennen. Zweitens konnen wir nie 
sicher sein, die AuBenwelt richtig beschrieben zu haben. Vielmehr konnen wir nur 
versuchen, immer naher an die Wahrheit heranzukommen, indem wir unsere 
Theorien streng uberpriifen und bereitwillig modifizieren. 

• Popper ist (gemaBigter) Skeptiker: Nicht nur Theorien und Hypothesen, sondern 
alle Beobachtungsaussagen sind seiner Meinung nach unsicher (fallibel ). 

• Popper ist Pragmatiker: Er lasst die in den Naturwissenschaften verbreiteten pro- 
babilistischen Theorien zu, obwohl sie streng genommen nicht falsifizierbar sind. 

• Popper ist Konventionalist: Er betont, dass Beobachtungsaussagen und Theorien 
nur durch Entscheidungen und Einigungen der Wissenschaftler akzeptiert oder 
verworfen werden konnen. 

Wir werden noch verschiedene Argumente fur Poppers Position kennen lernen, dass 
nicht nur alltagliche, sondern auch wissenschaftliche Erkenntnisse nie absolut sicher 
sind. Dennoch sind sie alien anderen moglichen Erkenntnisformen deutlich iiber- 
legen: Wissenschaftliche Erkenntnisse sind insgesamt praziser formuliert, systemati- 
scher Iiberpruft und objektiver abgesichert als alltagliche Erfahrungen, religiose 
Glaubenssatze, meditative Erlebnisse, klinstlerische Ausdrucksformen, astrologische 
Behauptungen usf. 

2.1.2 Erkenntnistheoretische Auffassungen in der Psychologie 

Nur wenige der in der psychologischen Forschung tatigen Wissenschaftler nehmen 

zo 

explizit zu erkenntnistheoretischen Problemen Stellung. Es gibt aber dennoch 
deutlich verschiedene erkenntnistheoretische Positionen in der Psychologie, die 
systematisch mit bedeutenden psychologischen Denk- und Forschungsrichtungen 
verbunden sind: der behavioristischen, der kognitivistischen und der physiologi- 
schen . 69 

Empiristische Positionen 

Empiristen sind die Behavioristen wie Watson, Hull und Skinner . 70 Die behavio- 
ristische Lern- und Motivationspsychologie beruht auf den Ergebnissen einer groBen 



67 Auch die Mathematik liefert keine sicher wahren Erkenntnisse liber die Welt, sondern 
nur Wahrheiten in einem System mit bestimmten Grundannahmen (siehe unten Kapitel 
3.4.3). 

68 z.B. Bischof (1974, 1981), Metzger (1975), Groeben (1986) 

69 Betrachtet man die Themen psychologischer Fachzeitschriften und Dissertationen, hat 
der Behaviorismus in den letzten Jahrzehnten sehr stark an Einfluss verloren, wahrend 
kognitivistische Ansatze dominierend geworden sind (Robins, Gosling & Craik, 1999). 
Bedeutender ist auch die neurobiologisch orientierte Psychologie gewonnen. Die 
Psychoanalyse wird hingegen nach wie vor nur wenig beachtet. 

70 Bower & Hilgard (1983, insbesondere S. 17-27) 
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Anzahl von kontrollierten Laboruntersuchungen, in denen empirische Beziehungen 
zwischen Reizen und Reaktionen oder zwischen Verhaltensweisen und ihren Kon- 
sequenzen unter verschiedenen Bedingungen systematisch analysiert wurden. Falls 
Theorien formuliert werden, sind sie stets eng an das Beobachtbare angebunden. 

Auch Vertreter der neurobiologischen und physiologischen Psychologie sind, 
entsprechend dem in weiten Teilen der Biologie iiblichen Vorgehen, empiristisch 
orientiert. Hauptziel scheint die Sammlung von vermeintlich sicherem Wissen liber 
konkrete biologische Strukturen und Prozesse zu sein, die mit psychischen 
Zustanden und Ablaufen zusammenhangen und sie erklaren sollen. Abstrakte 
Konzepte und integrierende Theorien spielen eine wesentlich geringere Rolle. 

Rationalistische Positionen 

Andere Bereiche der Psychologie, vor allem die Handlungspsychologie, die 
Kognitionspsychologie und die Personlichkeitspsychologie, beruhen stark auf 
abstrakten Modellvorstellungen, hypothetischen Konstrukten und theoretischen 
Annahmen, die zum Teil nicht direkt empirisch uberprtift werden konnen. 72 Diese 
Wissenschaftsbereiche sind damit rationalistisch ausgerichtet und eher am Vorbild 
der Physik als der Biologie orientiert. 

Gegeniiber den empiristischen haben die rationalistischen Positionen entscheiden- 
de Vorteile. Sie fordern die Entwicklung erklarender und integrierender Theorien 
und die Durchfiihrung strenger empirischer Priifexperimente. Die Ausrichtung wis- 
senschaftlicher Untersuchungen auf Theorien und Hypothesen verhindert, dass Be- 
obachtungs- und Experimentalergebnisse gesammelt werden, die schnell unliber- 
schaubar und uninterpretierbar werden und aus denen deshalb nie allgemeinere Er- 

77 

kenntnisse abgeleitet werden konnen. 

Idealistische Positionen 

Idealistische Auffassungen von der Rolle psychologischer Konzepte und Theorien 
werden von mehreren bekannten Psychologen vertreten. Theo Herrmann sieht 
kognitive Theorien als nutzliche Fiktionen an. 74 Diesem Instrumentalismus schlieBt 
sich Heinz Heckhausen in seinem Lehrbuch der Motivationspsychologie an: „In 
’Wirklichkeit’ gibt es tiberhaupt keine Motive ... Sie sind nur etwas Ausgedachtes, 

75 

eine gedankliche Hilfskonstruktion, eine Verstandigungshilfe ...“ 

Dies bedeutet aber nicht unbedingt, dass alle Objekte, die wir sinnlich 
wahrnehmen und sprachlich bezeichnen, in Wirklichkeit nicht existieren und nur 



z.B. Birbaumer & Schmidt (1999) 

72 siehe unten Kapitel 11.9.2 

73 

siehe unten Kapitel 9 bis 11 

74 Herrmann (1983) 

75 

Das Zitat stammt aus der ersten Auflage (Heckhausen, 1980, S. 28), in der zweiten 
Auflage wird diese Position weniger pragnant formuliert (Heckhausen, 1989, S. 9-10). 
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Produkte unserer Geistestatigkeit sind. Eine derartige streng idealistische Position 

widerspricht nicht nur dem Alltagsverstandnis der meisten Menschen. Sie kann auch 

• • 

nur schwer die hohe Ubereinstimmung erklaren, mit der verschiedene Personen diese 
angeblich nicht existente AuBenwelt beschreiben. Die idealistische Auffassung hat 
aber einen bedenkenswerten Kern: Wahrnehmung ist keine naturgetreue Abbildung, 
sondern in vielfacher Hinsicht von Erfahrungen, Einstellungen und Motiven 

HZ' 

abhangig. Scheinbar objektive Phanomene erweisen sich bei naherer Priifung als 
subjektive oder soziale Konstruktionen. 

Konstruktivistische Positionen 

Eine idealistische und instrumentalistische Auffassung vertreten auch die Konstruk- 
tivisten. Sie betonen, dass jeder Mensch seine Umwelt dadurch erkennt, dass er sich 
individuelle Bilder oder Modelle von ihr schafft und sie in seine Strukturen einpasst. 
Auch wissenschaftliche Begriffe, Modelle und Theorien sind ihrer Auffassung nach 
individuelle oder gemeinschaftliche Schopfungen . 77 

0 Aggression ist aus konstruktivistischer Sicht keine materielle Substanz, die beobachtbar 

und beschreibbar ist, sondern ein „Interpretationskonstrukt“: Personen interpretieren in 

78 

ihrem sozialen und sprachlichen Kontext bestimmte Geschehnisse als Aggression. 

Sehr bekannt ist in der Psychologie die konstruktivistische Sichtweise von Klaus 
Holzkamp. Er betonte die aktive, herstellende Rolle der Wissenschaftler wahrend des 
Forschungsprozesses. Sie registrieren nicht einfach das Vorhandene. Sie schaffen 
vielmehr durch ihre Beobachtungs-, Mess- und Experimentalmethoden planmaBig 
und bewusst Situationen und Bedingungskonstellationen, um zu demonstrieren, dass 
ihre Theorien und Hypothesen in diesen Realitatsausschnitten Geltung besitzen. Ziel 
ist es dabei nicht, die Theorien und Hypothesen zu falsifizieren. Bewahrt eine 
Theorie sich nicht, wird sie nach Holzkamps Analyse „exhauriert“, d.h. die Nicht- 
bewahrung wird auf storende Bedingungen zuruckgefiihrt. 



76 

Beispiele geben Lehrbticher der Wahrnehmungs-, Kognitions- und Sozialpsychologie 
(z.B. Anderson, 1996a; Kebeck, 1994; Stroebe, Hewstone & Stephenson, 1996). 

77 

konstruktivistische Philosophic: Knorr Cetina (1988), Watzlawik (1981), MittelstraB 
(1995b, S. 445-453), Stachowiak (1983b); Kritik: Hacking (1999); Konstruktivismus in 
der Psychologie: Toebe, Harnatt, Schwemmer & Werbik (1977), Kruse & Stadler 
(1987), Danziger (1990), Westmeyer (1995), Strube et al. (1996, S. 329-331), Hartmann 
(1998), Gergen (1986b, 1999). 

78 Bornewasser (1991, S. 154-155), Lenk (1978), Lenk & Marsal (1995) 

79 

Holzkamp (1964, 1968). Nach 1968 hat Holzkamp seinem Konstruktivismus eine 
„kritisch-emanzipatorische Wendung“ gegeben und ihn zu einer dialektisch- 
materialistischen „Kritischen Psychologie^ gemacht (Holzkamp, 1972, 1983). Zur 
Kritik: Brocke, Rohl & Westmeyer (1973), Gadenne (1978, 1984). 
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Realistische Positionen 

Trotz etlicher prominenter Instrumentalisten sind die meisten Wissenschaftler eher 
Realisten. Dies hat zwei unterschiedliche Griinde. 

• Der Realismus ist die naheliegende Position fur alle Personen, die sich mit 
moglichen erkenntnistheoretischen Alternativen nicht auseinandergesetzt haben. 
Kann die Wissenschaft, so denken sie, ein anderes Ziel haben, als herauszufinden, 
was tatsachlich ist? Was sollen psychologische Begriffe und Theorien anderes 
sein als Beschreibungen von tatsachlich existierenden Eigenschaften und 
Ablaufen? 

• Eine realistische Erkenntnistheorie ist von besonderer Attraktivitat, weil sie Ziele 
und Erfolge der Wissenschaft einfach erklaren kann: Wissenschaftliche Theorien 
sollen so weit wie moglich wahre Abbilder tatsachlicher (wenn auch unbeobacht- 
barer) Gegebenheiten sein und wissenschaftlicher Fortschritt besteht in einer 
immer starkeren Annaherung an diese realen Sachverhalte. 81 

Lokaler Realismus 

Die Entscheidung zwischen einer realistischen oder einer instrumentalistischen 
Interpretation muss nicht generell fur alle Begriffe und Theorien getroffen werden. 
Man kann vielmehr auch einige Begriffe realistisch interpretieren, andere hingegen 
nicht. 

0 Einerseits kann man annehmen, dass mit kognitionspsychologischen Begriffen (z.B. 
Arbeitsgedachtnis) im Idealfall (d.h. wenn die entsprechende Theorie wahr ist) reale 
Entitaten oder Funktionen innerhalb der Personen bezeichnet werden, und zwar ahnlich 
wie in der Physiologie mit dem Begriff „Kreislauf‘ eine reale Funktionseinheit unseres 
Korpers bezeichnet wird. Gleichzeitig kann man die Auffassung vertreten, dass bestimm- 
te Personlichkeitsmerkmale wie das „Anschlussmotiv“ Konstrukte sind und nur die inter- 
individuell unterschiedlichen Dispositionen (Neigungen, Wahrscheinlichkeiten) fiir 
bestimmte Arten von Verhaltensweisen beschreiben (z. B. die Tendenz, die Gemeinschaft 
mit anderen zu suchen). 

Mit konkreten realistischen Annahmen sollte man stets zuriickhaltend sein, wenn 
sich aus ihnen bedeutsame Konsequenzen ergeben. Wir konnen zwar mit den 
Realisten annehmen, dass wahre Theorien die Realitat zutreffend beschreiben. Da 
wir aber nie wissen, wie weit eine bestimmte Theorie noch von der Wahrheit entfernt 
ist, wissen wir auch nie, ob ihr und ihren Begriffen tatsachlich etwas Reales ent- 
spricht. Wenn wir in der Psychologie beispielsweise die Funktion des „Arbeits- 
gedachtnisses“ erforschen, die Vererbbarkeit der „Intelligenz“ untersuchen oder uns 
fragen, ob eine Person „neurotisch“ ist, mtissen wir uns bewusst sein, dass wir 



Bischof (1974), Gadenne (1984), Greenwood (1994), Harre (1986), Manicas & 
Rosenberg (1988), Manicas & Secord (1983), Nash (1999) 

Gadenne (1984, S. 164-180; 1994b, S. 313-318) 
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zundchst nur iiber „niitzliche Fiktionen“ reden, nicht unbedingt iiber real Existieren- 
des. 

AuBerdem sind realistische Annahmen in der Psychologie noch mit einer beson- 

deren Schwierigkeit behaftet. Selbst wenn wir alle zu Recht davon ausgehen, dass 

materielle Objekte wie Stlihle und Baume, Kopfe und Gehirne real existieren, ist es 

doch offen, inwieweit es geistige Zustande und Prozesse wie Gedanken, Gefuhle und 
• • 

Uberlegungen tatsachlich geben kann und in welcher Beziehung sie zu den materiel- 
len Objekten und Zustanden stehen. Diese Frage der Beziehung zwischen Korper 
und Geist wird ausfuhrlicher im folgenden Kapitel 2.2 behandelt. 



2.2 Die Beziehung zwischen Korperlichem und Geistigem 

Wenn man iiber Moglichkeiten und Grenzen wissenschaftlicher Erkenntnis in der 
Psychologie nachdenkt, stoBt man unweigerlich auf das Leib-Seele-Problem: In 
welcher Beziehung stehen das Geistige und das Korperliche? Die lange und intensive 
Diskussion dieses Problems hat eine eigene Teildisziplin hervorgebracht: die 
Philosophic des Geistes ( philosophy of mind), zu der neben Philosophen auch 
Psychologen, Informatiker und Neurobiologen beitragen. 

Anstelle der traditionellen Bezeichnungen Leib und Seele spricht man heute meist 
von Geist und Gehirn ( mind and brain ) bzw. von materiellen, korperlichen, objekti- 
ven, neuronalen, physiologischen oder physischen Zustanden einerseits und geisti- 
gen, psychischen, subjektiven oder mentalen Zustanden andererseits. 

Wir nehmen in der Regel an, dass mentale Zustande und ihre Inhalte real 
vorhanden sind, auch wenn sie jeweils nur der betreffenden Person zuganglich 
sind. 84 Doch gibt es neben den materiellen Dingen uberhaupt geistige Dinge? Und 
wenn ja: Konnen diese mentalen Zustande vollstandig durch korperliche Zustande 
erklart werden? Gibt es geistige Zustande nicht nur bei menschlichen Korpern, 



82 

Die folgenden Darstellungen beruhen vor allem auf Bechtel (1988a), Beckermann 
(1996a, 1997b), Carrier & MittelstraB (1989), Churchland (1988), Fodor (1981), 
Gadenne (1996, S. 123-135), Gadenne & Oswald (1991, S. 38-57), Hofstatter (1957, S. 
185-190) und Valentine (1991, S. 20-33). Empfehlenswert sind auch die Monographien 
von Hastedt (1989), Kim (1998b) und Beckermann (1999) sowie die Sammelbande von 
Beakley & Ludlow (1992), Bieri (1997) und Lycan (1990). 

83 Obwohl der Begriff der Seele direkt dem griechischen Wort psyche entspricht, wird er 
seit langerem in der wissenschaftlichen Psychologie nicht mehr verwendet, wahr- 
scheinlich weil er zu sehr mit religiosen Vorstellungen verkntipft ist (siehe unten Seite 
42). Ansonsten gibt es zwischen den unterschiedlichen Bezeichnungen fur korperliche 
und geistige Zustande jeweils keine klaren Bedeutungsunterschiede, so dass wir sie 
austauschbar verwenden konnen. AuBerdem bezeichnet der Begriff des Zustands hier 
alle Arten von Phanomenen, Prozessen und Ereignissen. 

84 zu Zuverlassigkeit introspektive Auskiinfte: Nisbett & Wilson (1977), White (1988), 
Valentine (1991, Kap. 5), Gopnik (1993) 
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sondern auch bei Computern? Wenn nein: warum nicht? Wie kann ein materieller 
Korper etwas Geistiges hervorbringen? Kann der Geist den Korper beeinflussen und, 
wennja, wie? 

In der psychologischen und medizinischen Praxis stoBt man auf das Problem der 
Beziehung zwischen Korper und Geist vor allem bei den Erkrankungen, die als 
psycho-somatisch bezeichnet werden, das heiBt bei denen psychische Bedingungen 

o c 

als wesentliche Ursachen angenommen werden. 

In der wissenschaftlichen Forschung beschaftigt man sich gegenwartig mit der 
Beziehung zwischen Geist und Gehirn vor allem dann, wenn in den Kognitions- und 

o/r 

Neurowissenschaften Fragen des Bewusstseins untersucht werden: Wie entsteht 

unser Erleben aus den materiellen Strukturen und Prozessen des Zentralen Nerven- 
systems? 1st bewusstes Erleben die Wahrnehmung von etwas real Existierendem 
oder folgen wir nur sprachlichen Gewohnheiten? Haben Schimpansen, haben Hunde 
ein Bewusstsein? Kann ein perfektes Computersystem bewusste Empfindungen ha- 
ben? 

Um keine falschen Hoffnungen zu wecken: Auf keine dieser Fragen gibt es eine 
eindeutig richtige Antwort. Wir werden im Folgenden nur einen Eindruck bekom- 
men konnen, welche Sichtweisen zur Beziehung zwischen Korper und Geist moglich 
sind. 

Grundpositionen 

Die Positionen zum Leib-Seele-Problem haben ihre Wurzeln in der griechischen Phi- 
losophic des vierten vorchristlichen Jahrhunderts. 

• Nach Platon konnen Leib und Seele unabhangig voneinander bestehen, der Leib 
ist lediglich ein Gefangnis fur die Seele. 

• Nach Aristoteles hingegen ist jeder Organismus eine Einheit, die aus Materie und 
Form, d.h. aus Leib und Seele besteht. 

Dementsprechend kann man die Positionen zum Verhaltnis zwischen Korper und 
Geist in zwei Gruppen einteilen: dualistische und monistische. 

• Dualisten nehmen an, dass geistige Zustande nicht nur ganz anders erscheinen als 
materielle Zustande, sondern sich auch von ihnen unterscheiden. 



z.B. Ulcus duodeni, essentielle Hypertonie, Colitis (Fahrenberg, 1989) 

86 siehe die sehr guten und verstandlichen Einfuhrungen von Churchland (1988) und 
Gadenne (1996), die ausgezeichnete Zusammenstellung von Metzinger (1995), die 
naturwissenschaftliche Fundierung von Scott (1995) sowie Allen (1997), Baars (1993), 
Beckermann (1997b), Crick (1994), Dennett (1991), Esken & Heckmann (1999), 
Flanagan (1992), Franke (1996), Ito (1997), Lahav (1993), Mandler (1997), Mohr 
(1997), Pekala (1991), Searle (1992), Singer (1994), Tye (1995, 1999), Valentine (1991, 
Kap. 4) und Windmann & Durstewitz (2000) 
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• Monisten nehmen an, dass Geist und Materie identisch sind, dass man den Geist 
auf die Materie reduzieren und ihn damit, wie man sagt, naturalisieren kann. 

In den Kapiteln 2.2.2 und 2.2.3 werden dualistische und monistische Positionen 
besprochen. In verschiedenen neueren Positionen sind dualistische und monistische 
Anteile kombiniert (Kapitel 2.2.4). Im folgenden Kapitel 2.2.1 wird erlautert, was 
unter dem Begriff des mentalen Zustands verstanden werden kann. 

2.2.1 Physische und mentale Zustande 

Die Unter scheidung zwischen Materiellem und Geistigem scheint auf den ersten 
Blick relativ unproblematisch zu sein. 

Die Gegenstande unserer Umwelt sind fur uns materiell. Sie haben abgrenzbare, 

quantitative Eigenschaften (Lange in Meter, Wassergehalt in Prozent usw.), ihre 

• • 

Auspragungen werden mit groBer Ubereinstimmung gemessen und zwischen ihnen 
bestehen naturgesetzliche Zusammenhange. Materiell ist natiirlich auch unser 
Korper, d.h. auch Nervensystem, Gehirn, Neurone, Synapsen, Transmitter usw. 

Unsere geistigen Zustande hingegen scheinen fur uns nicht an Materie gebunden 
zu sein, sie scheinen nicht nach festen Gesetzen abzulaufen und sie sind individuell 
und privat. Dies gilt insbesondere fur die Qualia : Bewusste Empfindungen mit 
einem uns selbst unmittelbar zuganglichen phanomenalen Gehalt, die nicht weiter 

07 

zerlegbar und schwer kommunizierbar erscheinen. 

0 Der Schmerz bei der Zahnbehandlung, der Geruch des frischen Kuchens, die Euphorie 
nach dem bestandenen Examen, das strahlende Gelb des bluhenden Rapsfelds und die 
Halluzinationen des Schizophrenen sind spezielle unmittelbare Erlebnisqualitaten. 

Zu den mentalen Zustanden gehoren auBerdem alle anderen moglichen Inhalte des 
Bewusstseins einer Person: ihre Kenntnisse, Meinungen, Beftirchtungen, Absichten, 
Wunsche usw. 88 Sie werden in der Philosophie als propositionale Einstellungen 
beschrieben. Das sind Aussagen der Person liber sich oder die AuBenwelt, zu der sie 
in bestimmter Weise Stellung bezieht. 89 

0 „Ich habe Kopfschmerzen“ und „New York ist die Hauptstadt der USA“ sind Aussagen 
(auch wenn sie falsch sind). „Ich habe Angst, dass ich wiitend werde“ und „Ich vermute, 
dass New York die Hauptstadt der USA ist“ sind propositionale Einstellungen. 



Strawson (1994), Tye (1995), Regenbogen & Meyer (1998, S. 537-538), Strube et al. 
(1996, S. 555), Windmann & Durstewitz (2000) 

88 

Der Begriff des Bewusstseins wird hier in einem weiten Sinn verwendet und umfasst 
alle mentalen Zustande, die die Person selbst registrieren kann. Alle anderen mentalen 
Ereignisse und Prozesse sind „unbewusst“. Das Bewusstsein im engeren Sinn besteht 

nur aus den mentalen Zustanden, auf die tatsachlich Aufmerksamkeit gerichtet ist. 

89 ^ 

Zu den propositionalen Einstellungen gehoren auch die Einstellungen ( attitudes ) im 

engeren Sinn, die positive oder negative Bewertungen von (sozialen) Objekten sind 
(Fishbein & Ajzen, 1975). 
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Durchaus sinnvoll kann es sein, zu den mentalen Zustanden einer Person auch 
unbewusste Prozesse und Ereignisse zu rechnen. Damit sind nicht so sehr die von der 
Psychoanalyse postulierten verdrangten Triebe und Konflikte gemeint, sondern vor 
allem die nicht bewusst zuganglichen kognitiven Verarbeitungsmechanismen, die 
wir annehmen miissen, um Wahrnehmen, Lernen, Denken und Sprechen zu erklaren. 

0 Viele geistige Ablaufe im Alltag sind hochautomatisiert: beispielsweise das Wieder- 
erkennen einer Person, das genaue Abschatzen einer Entfernung, das fliissige Lesen oder 
das sichere Radfahren. Sie miissen zum Teil mtihsam und bewusst erworben und getibt 
werden, konnen dann aber schnell und relativ fehlerfrei ausgefiihrt werden, ohne dass es 
einer bewussten Kontrolle bedarf. Kognitionspsychologisch erklart werden diese 
automatisierten und unbewussten Ablaufe zum Beispiel durch die Wirkung von Filtern, 
Merkmalsdetektoren, Mustervergleichen und Produktionsregeln. 

Bei der Prufung von Vermutungen fiber unbeobachtbare psychische Prozesse konnen 
verschiedene Indikatoren herangezogen werden, z.B. introspektive Auskunfte, 
Verhaltensbeobachtungen, LeistungsmaBe und neurophysiologische Messungen. 

Intentionalitdt 

Ein wesentliches Merkmal von mentalen Zustanden, insbesondere von propo- 
sitionalen Einstellungen, ist ihre Intentionalitdt. Sie sind auf etwas gerichtet oder 
bezogen, das auBerhalb des mentalen Systems liegt und erhalten dadurch ihre 
Bedeutung. 

0 Wahrnehmungen und Wiinsche sind mentale Zustande, die sich auf Objekte oder 
Situationen auBerhalb der Person beziehen, wahrend ihr Blutdruck ein nicht-intentionaler, 
physiologischer Zustand des Korpers ist. 

Etliche Philosophen vertreten die These, dass mentale Zustande sich von materiellen 
vor allem dadurch unterscheiden, dass ihre Bedeutung kausal wirksam sein kann: 
Menschen konnen auf die Bedeutung ihrer mentalen Zustande reagieren, wahrend 
Maschinen nur auf ihre physischen Zustande selbst reagieren konnen. 92 

Natur- und Geisteswissenschaften 

Die Unterscheidung zwischen Korperlichem und Geistigem wird haufig zum Anlass 
genommen, Gegenstandsbereiche, Ziele und Vorgehensweisen von Naturwissen- 
schaften und Geisteswissenschaften gegeneinander abzugrenzen. 



Anderson (1996a, Kap. 9) 

91 Searle (1987), Gerjets & Westermann (1997a, 1997b). Das Konzept der Intentionalitat 
mentaler Phanomene geht auf den Philosophen Franz Brentano zuriick, der Ende des 19. 
Jahrhunderts die Phdnomenologie und die empirische Psychologie mitbegriindete 
(MittelstraB, 1995b, S. 259-263). 

92 Beckermann (1989), Dennett (1981), Searle (1980) 
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Danach beziehen Naturwissenschaften sich auf korperlich existierende Objekte 
(z.B. rotierende Himmelskorper oder sich teilende Zellen), verwenden kontrollierte 
Beobachtungen und erklaren die Ergebnisse durch allgemeingiiltige Kausalgesetze. 

Geisteswissenschaften hingegen sollen sich auf mentale Objekte beziehen (z.B. 
emotionale Erlebnisse, philosophische Systeme oder historische Ablaufe) und diese 
in ihrer individuellen Einmaligkeit beschreiben und verstehen. Dazu dienen die 
interpretativen oder hermeneutischen Methoden. 

Diese Trennung ist aus mehreren Griinden nur eingeschrankt giiltig. 

• Einige inzwischen wohletablierte Wissenschaften sind nicht eindeutig einer dieser 
beiden Klassen zuzuordnen: z.B. Soziologie, Okonomie und insbesondere die 
Psychologie. Diese muss sich sowohl mit Korperlichem wie mit Geistigem 
beschaftigen, d.h. z.B. sowohl mit Korperbewegungen und physiologischen 
Reaktionen wie mit Denkoperationen oder Einstellungsanderungen. 

• Es gibt auch im mentalen und sozialen Bereich gesetzmaBige Ursache-Wirkungs- 
Beziehungen, die es zu entdecken gilt (siehe unten Kapitel 7.1). 

• Es hat sich gezeigt, dass kontrollierte Beobachtungen und experimentelle 
Untersuchungen auch in den psychologischen und sozialwissenschaftlichen 
Wissenschaftsbereichen erfolgreich zur Erkenntnisgewinnung eingesetzt werden 
konnen. 

• Erklaren und Verstehen schlieBen sich nicht aus. Vielmehr beinhaltet auch ein 
„einfiihlendes“ Verstehen stets Annahmen iiber mogliche Ursachen des 
gegebenen Sachverhalts (siehe unten Kapitel 8.2.5). 

2.2.2 Dualismus: Interaktionismus und Parallelismus 

Eine ausgesprochen dualistische Position zum Leib-Seele-Problem hat Rene 
Descartes im 17. Jahrhundert entwickelt. Er unterscheidet explizit 

• eine Welt des Korpers ( res extensa), die nach physikalischen Gesetzen 
funktioniert und bei der die „Korperkraft“ stets konstant bleibt, und 

• eine Welt des Geistes ( res cogitans ), die unabhangig vom Korper existieren kann 
und deren Krafte („Lebensgeister“, spiritus animales ) liber die Nervenbahnen die 
Korperkrafte in ihrer Richtung beeinflussen konnen. 

In vielen Kulturen ist die Trennung zwischen Korper und Geist fest verankert. 



93 

Die Hermeneutik ist die Lehre von der Auslegung, Deutung, Interpretation oder 
,,Dekonstruktion“ von sprachlichen AuBerungen (und anderen Verhaltensprodukten), bei 
der danach gestrebt wird, den Sinn des Einzelnen aus dem Sinnzusammenhang des 
Ganzen heraus zu verstehen (Eberhard, 1987, S. 81-85; MittelstraB, 1995b, S. 85-88; 
Regenbogen & Meyer, 1998, S. 286-287). Zur hermeneutischen und „verstehenden“ 
Psychologie: Dierstein (1995), Graumann (1982), Groeben (1986), Harrington (1999), 
Herzog (1984), Kriz, Luck & Heidbrink (1990), Rosenberg (1988, Kap. 4), Soeffner 
(1994), Valentine (1991, Kap. 14). 
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0 Das traditionelle Christentum (z.B. Thomas von Aquin) unterscheidet den (sterblichen) 
Korper von der (unsterblichen) Seele und spricht von einer „Auferstehung des Fleisches“ 
(am „Jungsten Tag“) und einer Wiedervereinigung mit der Seele. 

Innerhalb der dualistischen Positionen werden im wesentlichen zwei unterschiedli- 
che Annahmen liber das Verhaltnis von Korper und Geist gemacht: 

• Korperliche und geistige Substanzen konnen sich gegenseitig beeinflussen 
(Interaktionismus , wie bei Descartes), 

• Korper und Geist laufen stets harmonisch und gleichsinnig ab ( Parallelismus ). 

In Abbildung 2.1 sind die dualistischen Positionen zum Leib-Seele-Problem veran- 
schaulicht. 95 Dazu gehen wir von einer einfachen Situation aus: Ein Verhalten wird 
in tiblicher alltagspsychologischer Weise durch mentale Zustande erklart. 

0 Eine Person geht auf der Strandpromenade spazieren und befindet sich gerade vor ihrem 
Hotel. Sie bemerkt, dass es zu regnen anfangt (Mi). Sie entschlieBt sich, den Spaziergang 
abzubrechen (M 2 ) und lauft schnell in das Hotel hinein (P 3 ). 



Mj ► M 2 



Interaktionismus P, 




Parallelismus 





Abbildung 2.1: Veranschaulichung dualistischer Leib-Seele-Positionen 

Die physischen, d.h. die physiologischen und neuronalen Zustande bei der Wahrneh- 
mung (Mj) und der Entscheidung (M 2 ) werden als Pi und P 2 bezeichnet. 

0 Zu Pi gehoren alle (neuro-)physiologischen Aktivitaten des Wahrnehmungssy stems von 
der Retina bis zu den Assoziationsfeldern im Temporallappen, zu P 2 gehoren vor allem 
Aktivitaten des prafrontalen und motorischen Kortex . 96 



Regenbogen & Meyer (1998, S. 78), MittelstraB (1996, S. 425-426), Storig (1999, S. 
292-293) 

in Anlehnung an Carrier & MittelstraB (1989) und Gadenne (1997b) 

Birbaumer & Schmidt (1999), Goldstein (1997), Kornhuber (1993), Passingham (1995) 
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Interaktionismus 

Descartes Vorstellung der gegenseitigen Beeinflussung von Korper und Geist wird 
als Interaktionismus bezeichnet. Sie ist in Wissenschaft und Alltag weit verbreitet. 

0 Wir sind iiberzeugt, dass Handlungen durch Plane gesteuert werden, Angst zu Zittern 
fiihrt, Arger Magengeschwiire hervorruft, Totungen aus Eifersucht erfolgen usw. 

Vor allem entspricht es unserem Selbstverstandnis, dass wir einen freien Willen 
haben und unsere Korperbewegungen durch unseren Geist steuern konnen. 98 

0 Nach geltendem Recht ist eine tatbestandsgemaBe und rechtswidrige Handlung nur dann 
eine Straftat, wenn sie schuldhaft ist, das heiBt wenn die Person sich frei fiir das Unrecht 
entschieden hat, obwohl sie sich fiir rechtmaBiges Verhalten hatte entscheiden konnen. 99 

Im oberen Teil der Abbildung 2.1 ist die interaktionistische Sichtweise schematisiert: 
Der neuronale Zustand Pi ist die Ursache fiir den mentalen Zustand M h dieser ist die 
Ursache fiir einen zweiten mentalen Zustand M 2 . Der mentale Zustand M 2 wiederum 
kann, und dies ist wesentliche Annahme des Interaktionismus, die Ursache fiir einen 
physischen Zustand P 2 sein. Dieser ruft dann das offene Verhalten P 3 hervor. 

Die bekanntesten interaktionistischen Positionen in der neueren Zeit vertreten 
Karl Popper und der Neurophysiologe John Eccles. 100 Sie sind nicht nur Dualisten, 
sondern sogar Trialisten, deren drei „Welten“ sich gegenseitig beeinflussen: 

• die „Welt 1“ der physikalischen Objekte und Zustande, 

• die „Welt 2“ der mentalen Erlebnisse und Aktivitaten und 

• die „Welt 3“ der „objektiven Ideen“, der moglichen Gegenstande und Produkte 
des Denkens. 

Zur Welt 3 gehoren politische Ideologien, lyrische Werke, wissenschaftliche Theo- 
rien usw. Sie beeinflussen unser Denken (Welt 2). Das wiederum wirkt auf Verhalten 
und materielle Umwelt ( Welt 1 ). 

Die Hauptschwierigkeit interaktionalistischer Positionen liegt in der Frage, wie 
und wo Korper und Geist aufeinander wirken konnen. Eine Wirkung nicht-mate- 



Fahrenberg (1989) 

98 ^ 

philosophische, psychologische und neurobiologische Analysen der Willensfreiheit: 
Libet (1985), Carnap (1986, S. 216-222), Groeben (1986, S. 303-313), Kornhuber 
(1993), Cranach & Foppa (1996), Skinner (1973), Strawson (1994, S. 177-187), 
Valentine (1991, Kap. 2), Walter (1997), Libet, Freeman & Sutherland (1999). In der 
Philosphie haben vor allem Descartes und Kant die unbeschrankte Willensfreiheit des 
Menschen vertreten. Gegen eine Freiheit des Willens und fiir die vollstandige 
Determination aller Entscheidungen und Handlungen argumentierten Spinoza, Leibniz, 
Hume und die Materialisten (siehe unten Seite 47). 

99 Golding (1992), Schreiber (1986) 

100 Popper & Eccles (1982), Eccles (1985), Popper (1984, S. 158-160), Seiffert & 
Radnitzky (1989, S. 101-106). Dualistische und interaktionistische Postitionen vertreten 
auch Carrier & MittelstraB (1989), Pietroski (1994) und Hosle (1999). 
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rieller Objekte, Zustande oder Eigenschaften auf materielle Zustande kann nach den 
Vorstellungen der klassischen Physik nur zustande kommen, wenn Energie zwischen 
dem mentalen und dem materiellen System ausgetauscht werden wlirde. Dies 
konfligiert aber mit der Vorstellung, dass mentale Zustande energie- und materielos 
sind. Vor allem aber verstoBt sie gegen das klassische Prinzip, dass innerhalb 
physikalischer Systeme die Gesamtmenge an Energie stets konstant bleibt. 101 Diese 
Probleme konnen bei einem Parallelismus vermieden werden. 

Parallelismus 

Im unteren Teil der Abbildung 2.1 ist der Parallelismus veranschaulicht. Es wird 
angenommen, dass mentale und physische Zustande nebeneinander und miteinander 
koordiniert existieren: Die mentalen Zustande M b M 2 usw. entsprechen jeweils 
eindeutig einem physischen oder neuronalen Zustand P b P 2 usw. Es bestehen aber 
keine kausalen Beziehungen zwischen physischen und mentalen Zustanden. Parallel 
zu den kausalen Beziehungen zwischen den physischen Zustanden konnen jedoch 
kausale Beziehungen zwischen den mentalen Zustanden angenommen werden. Diese 
spezifischen mentalen GesetzmaBigkeiten zu untersuchen, wird seit jeher von vielen 
Psychologen als Hauptaufgabe der wissenschaftlichen Psychologie angesehen. 

0 Explizit finden sich parallelistische Sichtweisen in der Bewusstseinspsychologie von 

102 

Wilhelm Wundt sowie in der Gestaltpsychologie mit ihrem Isomorphieprinzip. 

Der Parallelismus ist mit zwei kritischen Fragen konfrontiert. Warum gibt es neben 
den physischen Zustanden iiberhaupt mentale Zustande, wenn diese keinerlei kausale 
Wirksamkeit entfalten? Durch welche Mechanismen wird der gleichsinnige Ablauf 
von physischen und mentalen Prozessen aufrechterhalten? Da beide Fragen nicht 
befriedigend zu beantworten sind, gehen parallelistische Positionen oft flieBend in 
eine monistische liber: die Identitatslehre. 

2.2.3 Monismus 

Die monistische Sichtweise des Aristoteles wurde im 17. Jahrhundert von Spinoza 
wieder aufgegriffen. Nach Spinoza sind Korper und Seele keine selbstandigen 
Substanzen, sondem Daseinsformen (modi) einer unendlichen Substanz. Spinozas 
Monismus fiihrte zur neueren Identitats- und Komplementaritatslehre (Kapitel 
2.2.3. 1), und sie ist der Ursprung des Materialismus , der die erkenntnistheoretische 
Grundlage sowohl der marxistischen wie der behavioristischen Richtungen der 



101 Auf der Basis der Quantenphysik ist allerdings kausale Wirksamkeit auch ohne 
Energietibertragung denkbar (Eccles, 1994; kritisch dazu: Scott, 1995, S. 25-26, 136- 
138, 163-167). 

102 Eckhardt (1983, S. 955), Scheerer (1996, S. 98), Bischof (1974, S. 29) 
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Psychologie ist (Kapitel 2.2.3. 2). In seiner strengsten Form fiihrt er zu der Forde- 
rung, alle psychologischen Begriffe zu eliminieren (Kapitel 2. 2. 3. 3). 103 



2.2.3.1 Identitatslehre 

Nach der Identitatslehre kann der Unterschied zwischen Seelischem und Korperli- 
chem, der fur uns im Alltag ganz offensichtlich ist, nur eine Illusion sein. Mentale 
Zustande sind vielmehr stets identisch mit physischen Zustanden: So wie die 
Temperatur identisch mit der kinetischen Energie und der Schall identisch mit der 
Druckwelle ist. Wenn zwischen zwei physischen Zustanden eine kausale Beziehung 
besteht, dann besteht folglich auch zwischen den mit ihnen identischen mentalen 
Zustanden eine kausale Beziehung. Im oberen Teil der Abbildung 2.2 ist die Identitat 
durch das entsprechende mathematische Zeichen = symbolisiert. 104 

0 Die von einer Person empfundene Freude ist mit einem bestimmten neurophysiologischen 
Zustand identisch. Die Freude bzw. der mit ihr identische physische Zustand kann 
Ursache fur einen anderen physischen Zustand, z.B. einen Jubelschrei, sein. 

Mj ► M 2 



Identitatslehre P t 




M { ♦ M 2 

A A 

Materialismus 

Epiphanomenalismus P t *. p 2 p 



X, X 2 

rad. Behaviorismus 

elimin. Materialismus p ► P 2 ► P 3 

Abbildung 2.2: Veranschaulichung monistischer Leib-Seele-Positionen 



103 Zu den monistischen Positionen gehoren auch die idealistischen, nach dem materielle 
Objekte nur in der Vorstellung existieren (siehe oben Kapitel 2.1.1). In der Diskussion 
des Leib-Seele-Problems spielen sie keine groBe Rolle. Zwar betrachten Instramen- 
talisten die Zustande und Variablen in wissenschaftlichen Theorien als etwas Ausge- 
dachtes, sie behaupten aber nicht unbedingt, dass es keine materiellen Zustande gibt. 

104 Die Identitatslehre kann als Grenzfall der Annahme einer Parallelitat von Korper und 
Geist betrachtet werden, die wir als eine Form des Dualismus beschrieben haben. 
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Nach der Identitatslehre konnen mentale und physikalische Begriffe gleiche Gegen- 
stande bezeichnen, aber etwas Unterschiedliches ausdrlicken. Ihre referentielle oder 
extensionale Bedeutung ist dann gleich, ihre intensionale Bedeutung aber 
unterschiedlich. 105 Dies auBert sich z.B. darin, dass man zur Untersuchung mentaler 
und korperlicher Zustande verschiedene Vorgehensweisen wahlen muss. 

In der analytischen Philosophie hat Herbert Feigl eine identitatstheoretische Posi- 
tion vertreten. Er unterscheidet drei Sprachen und Beschreibungsebenen: 

• die Beschreibungen von subjektiven Erlebnissen durch mentale Begriffe, 

• die Beschreibungen von Verhaltensweisen durch behavioristische Begriffe und 

• die Beschreibungen von Gehirnprozessen durch neurophysiologische Begriffe. 

Sie beziehen sich zwar auf den gleichen Gegenstand. Sie sind aber nicht aufeinander 
reduzierbar. Insbesondere konnen Erlebnisse nicht behavioristisch oder neuro- 
physiologisch ausgedrlickt werden. 

In der Psychologic war Gustav Theodor Fechner der bedeutendste Vertreter einer 
Identitatslehre. Korperliche und geistige Zustande sind fur ihn komplementar: unter- 
schiedliche Aspekte oder Erscheinungsformen derselben Sache von verschiedenen 
Standpunkten aus, wie das Konkave und das Konvexe bei einem Kreisbogen. So 
kann auch das menschliche Gehirn von auBen und innen betrachtet werden: Was von 
auBen als physischer Prozess erscheint, ist von innen ein psychischer. 108 

Die Komplementaritat von Korper und Geist ist auch gegenwartig noch eine at- 
traktive Vorstellung, insbesondere ftir die physiologische Psychologie. 

0 Explizit legt Jochen Fahrenberg seiner Forschung ein Komplementaritatsmodell 
zugrunde. Peripher-physiologische und erlebnispsychologische Variablen sind fur ihn 
unterschiedliche Betrachtungsweisen derselben Bezugsobjekte, die beide notwendig und 
nicht aufeinander reduzierbar sind. 109 Deshalb mussen Aufmerksamkeit, Stress, 
Emotionen und andere psycho-physische Prozesse stets auf mehreren Ebenen betrachtet 
werden. Der zu erwartende enge Zusammenhang zwischen psychologischen und 
physiologischen Variablen wird empirisch allerdings nur relativ selten deutlich. 



105 Auch die Begriffe „Abendstern“ und „Morgenstern“ haben die gleiche Bedeutung (sie 
referieren auf den Planeten Venus), aber unterschiedlichen Sinn (vgl. Abschn. 5.1). 

106 Feigl (1958, 1973), siehe auch Stegmtiller (1969, S. 497-504), Place (1956), Vollmer 
(1988) 

107 Heute kennen wir verschiedene Komplementaritaten aus der Quantenphysik. 
Insbesondere verhalt sich das Licht je nach Versuchsanordnung wie eine Welle oder wie 
ein Strom von Korpuskeln (MittelstraB, 1995b, S. 427, 469, 477-478). 

108 Fechner (1860, S. 3-4), Prinz (1990, S. 33), Scheerer (1996, S. 92). Das Ziel von 
Fechners Psychophysik bestand darin, mit naturwissenschaftlichen Methoden die 
funktionellen Beziehungen zwischen den physischen und den geistigen Erschei- 
nungsformen festzustellen (Gescheider, 1985; Prinz, 1990; Westermann, 1987b). Seine 
erkenntnistheoretische Position ist nicht ganz eindeutig und wird oft auch als 
parallelistisch gekennzeichnet (MittelstraB, 1995c, S. 51). 

109 Fahrenberg (1979, 1989, 1992), Horhold (1998) 
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In der philosophischen Diskussion findet sich die Vorstellung der Komplementaritat 
in den monistischen, nicht-reduktiven Positionen wieder (siehe Kapitel 2.2.4). 

2.2.3.2 Materialismus 

Fur den Materialismus ist das Physische das Primare und Entscheidende. Er wird 
deshalb auch als Physikalismus bezeichnet. In den strikten Formen des Materialis- 
mus gibt es tiberhaupt keine geistigen Zustande, sondern nur korperliche. In abge- 
schwachten Formen des Materialismus wird die Existenz mentaler Zustande zwar 
anerkannt, es wird aber angenommen, dass sie vollstandig durch die physischen Zu- 
stande bestimmt sind. 

Mit dem Materialismus verbunden ist in der Regel die Annahme eines universel- 
len Determinismus : Jedes Ereignis, jeder Zustand in der Welt hat eine Ursache, d.h. 
ist durch andere materielle Ereignisse oder Zustande hervorgerufen worden. 
Konsequente Materialisten wenden dieses Prinzip auch auf Zustande an, die uns als 
mental erscheinen: Jeder dem Anschein nach mentale Zustand hat eine physische 
Ursache. Insbesondere sind alle Entscheidungen und Handlungen eines Menschen 
eindeutig durch physische Zustande (seines Korpers, vor allem seines Zentralen 
Nervensystems) vorherbestimmt. Die von uns empfundene Freiheit des Willens und 
der Entscheidung ist danach nur eine Illusion, die Verantwortlichkeit des Menschen 
fur seine Handlungen und deren Folge nur eine Fiktion. 

Epiphanomenalismus 

Mentale Zustande werden von Materialisten mitunter als Epiphdnomene bezeichnet: 
als Begleiterscheinungen, die von den physischen Zustanden hervorgerufen werden, 
selbst aber keine kausalen Wirkungen auf die physischen Zustande haben. 110 

0 Fiir Epiphanomenalisten sind mentale Zustande wie die Schatten, die eine Karawane in 
der Wiiste wirft: Sie sind existent, verandern sich je nach Bewegung der Tiere und 
Menschen in gesetzmaBiger Weise, haben aber keine Wirkung auf diese Bewegungen. 

Zwischen den Epiphanomenen konnen gesetzmaBige Beziehungen bestehen, die 
allerdings von den meisten Autoren nicht als kausale Beziehungen interpretiert 
werden. Dies ist in Abbildung 2.2 durch den gestrichelten Pfeil ausgedriickt. 

0 In der Psychologie vertritt Wolfgang Prinz explizit eine epiphanomenalistische Position. 
Ziele, Entscheidungen, Plane und andere Willenserscheinungen sind fiir ihn nur 
subjektive Begleitphanomene objektiver Prozesse. Zwischen ihnen konnen zwar kausale 
Beziehungen bestehen. Sie konnen aber keine Ursachen fiir korperliche Reaktionen sein, 
diese konnen nur durch die neuronale Prozesse und Ereignisse hervorgerufen werden. 1 1 1 



no 



in 



Kondakow (1978, S. 333), Regenbogen & Meyer (1998, S. 377, 400). Der Epiphano- 
menalismus kann auch als eine Form des Dualismus betrachtet werden, insbesondere 
wenn die speziellen Merkmale des Mentalen stark akzentuiert werden. 

Prinz (1998) 
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Neurobiologisch gestutzt wird die epiphanomenalistische Position zum Beispiel 

durch Befunde, nach denen sich das subjektive Geftihl eines Entschlusses erst etwa 

112 

eine halbe Sekunde nach entsprechenden Bereitschaftspotentialen einstellt. 
Dialektischer Materialismus 

In der Sowjetunion und der DDR basierte die gesamte Wissenschaft (zumindest 
offiziell) auf der marxistisch-leninistischen Philosophie und damit auf einer dialek- 

113 

tisch-materialistischen Erkenntnistheorie. 

0 In seinem Lehrbuch der Allgemeinen Psychologie leitet F. Klix seine „methodologische 
Orientierung“ explizit „aus der Position der dialektisch-marxistischen Erkenntnistheorie" 
ab und schreibt: „Es ist unbestreitbar, dass alle psychischen Prozesse in den Funktions- 
prinzipien der hochorganisierten materiellen Strukturen des Nervensystems ihre Grundla- 
ge und ihre Entsprechung haben“. 114 

Nach dialektisch-materialististischer Auffassung gehoren auch psychische Zustande 
mit zu der einheitlichen materiellen Welt. Im Bewusstsein wird die objektiv 
vorhandene auBere Realitat nicht rein mechanisch abgebildet. Das Bewusstsein ist 
vielmehr eine Widerspiegelung, die durch eine aktive, sozial und historisch vermit- 
telte Tatigkeit der Person zustande kommt. 115 

Behaviorismus 

Psychologen mit materialistischen erkenntnistheoretischen Auffassungen finden sich 
auch unter den Behavioristen. Innerhalb der behavioristischen Psychologie gibt es 
etliche unterschiedliche Ausrichtungen. 116 Fiir unsere erkenntnistheoretische Analyse 
sind vor allem metaphysische von methodologischen Behavioristen zu unterschei- 
den. 

• Dem metaphysischen Behaviorismus liegt mehr oder minder explizit die Annahme 
zugrunde, dass es keine mentalen und bewussten Zustande und Prozesse gibt. 
Ursachen fiir Verhalten konnen nur beobachtbare Reize oder Konsequenzen sein. 

0 John Watson definiert eine Emotion als ein bestimmtes Muster von beobachtbaren 
korperlichen Reaktionen. Erlebensaspekte von Emotionen werden nicht erwahnt. 

0 Nach Skinner wird Verhalten ausschlieBlich durch seine Folgen gestaltet und 
aufrechterhalten (operante Verhaltenstheorie ). Zwar konnen Menschen diese 
RegelmaBigkeiten sprachlich beschreiben, das Verhalten wird aber nicht durch 



Libet (1983), Kornhuber (1993), Birbaumer & Schmidt (1999, S. 524) 

113 Die Dialektik ist die Lehre vom Kampf und der Einheit der Gegensatze. Der dialektische 
Materialismus von Engels, Marx und Lenin dehnt den Materialismus auf die 
Interpretation gesellschaftlicher Erscheinungen aus (Kondakow, 1978, S. 334). 

114 Klix (1971, S. 18-19) 

115 Speck (1980, S. 1, 389-392), Breuer (1988) 

116 Ickler (1994), Schorr (1993), Westmeyer (1984) 

117 Meyer, Schiitzwohl & Reisenzein (1993, S. 48) 
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Wissen, Reprasentationen oder andere inneren Instanzen hervorgebracht. Verbale und 
subjektive Daten sind nur Berichte liber korperliche Zustande und Geschehnisse. 118 
• Im methodologischen Behaviorismus ist die Beschrankung auf Beobachtbares 
keine Konsequenz einer monistischen oder materialistischen Weltanschauung. Sie 
ist eine Konvention, um unkontrollierbare Spekulationen zu vermeiden und die 
Psychologie in den Kreis der Naturwissenschaften mit festen Erkenntnis- 
grundlagen einzuflihren. Wenn Begriffe verwendet werden, die sich auf nicht 
direkt Beobachtbares beziehen, werden sie als sprachliche Klirzel fur 
Dispositionen zu genau spezifizierten physischen Zustanden oder Verhaltens- 
weisen verstanden . 119 

0 Das Attribut „wtitend“ bezeichnet keinen unbeobachtbaren mentalen Zustand einer 
Person, sondern ist gleichbedeutend mit ihrer Neigung, in bestimmter Weise zu 
reagieren (die Zahne zu fletschen, zu schreien usw.), wenn bestimmte Bedingungen 
(ein auslosender Reiz, keine hemmenden Strafandrohungen usw.) gegeben sind. 

0 Neobehavioristen wie Clark Hull, Neal Miller und Hobart Mowrer verwenden 
Begriffe, die sich auf unbeobachtbare GroBen beziehen, sie verbinden diese 
intervenierenden Variablen aber genau mit beobachtbaren GroBen. So hangt nach 
der Theorie Hulls die (unbeobachtbare) Habitstarke direkt von der Anzahl der 
verstarkten Kopplungen zwischen Reiz und Reaktion ab. 

2.2.3.3 Eliminativer Materialismus 

Recht bekannt geworden ist der strikte, hauptsachlich von Patricia und Paul 

121 

Churchland vertretene eliminative Materialismus. Sie gehen, ahnlich wie radikale 
Behavioristen, dezidiert davon aus, dass es keine mentalen Phanomene gibt und dass 
alle Aussagen fiber mentale Phanomene unwissenschaftlich und falsch sind. 
Psychologische Begriffe und Aussagen fiber mentale Phanomene werden sich nach 
ihrer Ansicht als genau so uberfliissig und irreffihrend erweisen wie Annahmen fiber 
Hexen und Geister im Mittelalter oder Annahmen fiber Warme- und Verbrennungs- 
substanzen in der friihen Naturwissenschaft. Sie miissen deshalb eliminiert und durch 
Begriffe und Aussagen fiber Gehirnzustande und Gehirnprozesse ersetzt werden . 122 

0 Aus Sicht des eliminativen Materialismus sind alle psychologischen Annahmen falsch, 
die zu Stmktur und Funktion von Wahrnehmung, Denken, Emotion, Handlungssteuerung 
usw. formuliert worden sind. Psychologische Begriffe wie Aufmerksamkeit, Langzeit- 
gedachtnis, Einstellungen, Attribution, Extraversion usw. sind uberfliissig. 



118 

Skinner (1984, 1985), als operanter oder radikaler Behaviorismus bezeichnet 

119 Dieser Behaviorismus ergibt sich aus Analysen zur Theorie- und Beobachtungssprache 
der Logischen Empiristen (siehe unten Kapitel 5.3 und 11.1.1). Er wird auch als 
logischer oder analytischer Behaviorismus bezeichnet (Ryle, 1969). 

120 Bower & Hilgard (1983, Kap. 5). 

121 Patricia S. Churchland (1986), Paul M. Churchland (1981, 1997) 

122 

Kognitive Leistungen werden stattdessen z.B. durch konnektionistische Netzwerke 
(PDP-Modelle) erklart (Bern & Looren de Jong, 1997; Churchland, 1988). 
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Der eliminative Materialismus stellt fur die Psychologie eine ernste Herausforderung 
dar. Sie hatte lediglich die Aufgabe, sich durch Wissenschaften vom Nervensystem 
(Neurowissenschaften) ersetzen zu lassen. 

Begriindet wird der eliminative Materialismus mit den regelmaBigen empirischen 
Zusammenhangen zwischen Gehirnlasionen und psychischen Ausfallen sowie 
zwischen Bewusstsein und Gehirnaktivitaten. 123 Dementsprechend klingen elimina- 
tive materialistische Positionen vor allem bei neurophysiologisch orientierten Psy- 
chologen an. 

0 „Zum Leib-Seele-Problem ist festzuhalten, dass psychische Prozesse und Verhalten 
vollstandig und ausschlieBlich von der Hirntatigkeit abhangig sind“ schreiben Nils 

124 

Birbaumer und Robert F. Schmidt in ihrem Lehrbuch der Biologischen Psychologie. 

Die eliminativen Materialisten weisen gern darauf hin, dass in der Alltags- 
psychologie (folk psychology ) Verhaltens weisen meist dadurch erklart werden, dass 
man der Person Motive, Wlinsche und Uberzeugungen unterstellt. 

0 Dass mein Kollege das Biiro verlasst, erklare ich dadurch, dass er zur Mittagszeit hungrig 
ist und dass er erwartet, in der Kantine etwas zu essen zu bekommen. 

Diese Verhaltenserklarungen werden als unzureichend betrachtet und als Argument 
fur die Elimination aller mentalen Begriffe verwendet. Dabei wird jedoch 
falschlicherweise die wissenschaftliche Psychologie mit der Alltagspsychologie 
gleichgesetzt. 126 Die wissenschaftliche Psychologie besteht keineswegs darin, indivi- 
duelles Verhalten durch Wunsche und Uberzeugungen zu erklaren. Sie beschaftigt 
sich vielmehr mit der Aufstellung und empirischen Priifung gesetzmaBiger und inter- 
individueller Zusammenhange zwischen verschiedenen Ursache- und Wirkungs- 
variablen. 

0 Nach der Rubikontheorie wagen Personen vor der Bildung einer Absicht die moglichen 
Ziele gegeneinander ab, indem sie ihre Wiinschbarkeit und ihre Realisierbarkeit 

127 

einschatzen und die Alternative mit dem hochsten Erwartungswert wahlen. 



123 

Die Befunde sind insgesamt noch recht instabil und mehrdeutig. Eine viel beachtete 
Theorie nimmt an, dass bewusstes Erleben nur moglich ist, wenn die 
Ubertragungseigenschaften von NMDA-Synapsen schnell verandert werden konnen. 
(Churchland, 1996; Flohr, 1992, 1996). Dies ermoglicht schnelle Gruppierungen und 
Synchronisationen von Neuronen (cell assemblies , Hebb, 1949; Pulvermiiller, 1999). 
Diejenigen dieser Zellverbande, die andere Zustande reprasentieren, entsprechen 
bewussten Zustanden (kritisch dazu Beckermann, 1996b). 

124 Birbaumer & Schmidt (1999, S. 7) 

125 Dennett (1981), Dretske (1988) 

1 26 

Die Psychologie der Menschen im Alltag sind ein moglicher Untersuchungsgegenstand 
der wissenschaftlichen Psychologie (Lillard, 1998; Smedslund, 1997; von Eckardt, 
1997; Weiner, 1988). Die Begriffe und Annahmen der Kognitionspsychologie gehen 
aber weit liber die Alltagspsychologie hinaus (Gadenne, 1994c; Stich, 1983). 

127 

Gollwitzer (1996), zu anderen Kriterien: Jungermann, Pfister & Fischer (1998) 
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Probleme 

Gegen den eliminativen Materialismus spricht vor allem, dass eine Betrachtung der 
physischen Zustande nicht ausreichend zu sein scheint, um Erlebnisqualitaten, 
Bewusstseinszustande und andere mentale Zustande zu beschreiben und zu erklaren 
(. Argument des unvollstandigen Wissens). Insbesondere die individuellen Erlebnis- 
qualitaten ( Qualia ) scheinen liber die materiellen Zustande hinauszugehen. 

0 Stellen wir uns vor, die geniale Naturwissenschaftlerin Mary ist von Geburt an farben- 
blind. Sie hat sich alles physikalische und biologische Wissen iiber die Farbwahrnehmung 
angeeignet. Auch kann sie mit ihren Geraten z.B. alle Farbnuancen in einem Gemalde 
unterscheiden. Sie kann aber nie wissen, was man empfindet, wenn man ein Gemalde im 
Original betrachtet. Falls die angeborene Farbblindheit plotzlich beseitigt wird und Mary 

eine Impressionistenausstellung besucht, wiirde sie etwas Neues erleben, das aus ihrem 

128 

physikalischen und biologischen Wissen nicht vorhersagbar ist. 

Selbst wenn alle mentalen Phanomene tatsachlich ausschlieBlich neuronale Phano- 
mene waren (d.h. wenn der Materialismus ontologisch zutreffen wiirde), konnte es 
methodised notwendig sein, mentale Phanomene anders zu beschreiben und zu erkla- 
ren als Gehirnprozesse. Die physischen Strukturen und Prozesse im Gehirn sind so 
umfangreich und komplex, dass es fraglich ist, ob mentale Phanomene auf dieser 
materiellen Ebene in absehbarer Zeit hinreichend einfach und iibersichtlich zu 
beschreiben und zu erklaren sind. 

Insgesamt gibt es gute Grlinde, mentale Begriffe und psychologische Erklarungen 
nicht zu eliminieren. Ziel sollte vielmehr die systematische Verkniipfung des psycho- 
logischen und neurobiologischen Wissens sein. 129 

2.2.4 Nichtreduktiv-monistische Positionen 

In den letzten Jahrzehnten haben sich nacheinander zwei miteinander verbundene 
Gruppen von Positionen herausgebildet, die mentale Zustande zwar nicht von der 
materiellen Welt trennen, das Psychische aber auch nicht vollstandig auf das Physi- 
sche zuriickflihren: der Funktionalismus (Kapitel 2.2.4. 1) und der nicht-reduktive 
Physikalismus (Kapitel 2. 2.4.2). 

2.2.4.1 Funktionalismus 

Die funktionalistische Auffassung wurde vor allem von Hilary Putnam und Jerry 
Fodor entwickelt. Sie haben damit nicht nur die philosophischen Uberlegungen 



128 

129 

130 



nach dem „Gedankenexperiment“ von Jackson (1982) 

siehe Kapitel 11.6 zur systematischen Verkniipfung unterschiedlicher Theorien 

Fodor (1968, 1992), Putnam (1975, 1992a, 1992b), Pylyshyn (1984), Looren de Jong 

(1997) 
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zum Leib-Seele-Problem entscheidend beeinflusst, sondern auch die erkenntnis- 
theoretischen Grundlagen der Kognitionswissenschaft formuliert. 131 

Ebenen der Analyse 

Gegenstandsbereich der Kognitionswissenschaft, insbesondere der Kognitions- 
psychologie sind geistige Phanomene, Funktionen und Prozesse: Wahrnehmen, Fiih- 
len, Beurteilen, Behalten, Erinnern, Denken. Die bewussten oder unbewussten men- 
talen Zustande und Prozesse konnen aus unterschiedlichen Perspektiven und mit 
verschiedenen Begrifflichkeiten beschrieben und erklart werden. Man unterscheidet 
dabei die mentale, funktionale und neuronale Ebene. 

• Auf der mentalen Ebene werden geistige Zustande aus einer intentionalen 
Perspektive beschrieben und erklart: Der Mensch wird als denkendes, handelndes 
und verstehendes Subjekt gesehen, das Werte hat, Ziele verfolgt, Bewertungen 
trifft und nach bestimmten Prinzipien entscheidet und handelt. 

• Es ist unstrittig, dass mentale Zustande eine physische Basis haben: die Nerven- 
zellen des Gehirns mit ihren Axonen, Dendriten und Synapsen. Die Prozesse auf 
dieser neuronalen Ebene werden aus einer mechanistischen Perspektive be- 
schrieben und erklart: durch biologische, chemische und physikalische Variablen 
und GesetzmaBigkeiten. 

• Um die Grundlagen des menschlichen Geistes zu analysieren, geniigt es nach 
Auffassung der Kognitionspsychologen nicht, das neuronale System zu 
betrachten. Die mentalen Zustande, Phanomene und Prozesse konnen vielmehr 
nur erklart werden, wenn auch ihre Bedeutung beriicksichtigt wird. Dazu ist es 
notwendig, zwischen der mentalen Ebene und der neuronalen Ebene eine dritte, 
vermittelnde Ebene einzufiihren: die syntaktische Ebene, Programmebene oder 
Verarbeitungsebene. Die menschliche Geistestatigkeit wird hier aus einer 
funktionalen Perspektive beschrieben: als Informationsverarbeitungssystem, in 
dem Symbole nach veranderbaren Regeln oder Programmen kombiniert und 
transformiert werden. Die Symbole sind dabei Reprdsentationen von (tatsach- 
lichen oder gedachten) Objekten der AuBenwelt und bekommen dadurch ihre 
Bedeutung. 

Funktionale Zustande 

Die Zustande eines informationsverarbeitenden Systems und damit auch die 
mentalen Zustande von Menschen werden ausschlieBlich durch ihre Funktionen cha- 
rakterisiert, das heiBt durch ihre kausalen Beziehungen zu anderen mentalen Zu- 

131 

Zur Kognitionswissenschaft gehoren die Kognitionspsychologie und Teile der Informa- 
tik, Linguistik und Neurobiologie. Zu Grundannahmen und Perspektiven: Bern & 
Looren de Jong (1997), Fodor & Pylyshyn (1992), Herrmann (1987), Lachman, 
Lachman & Butterfield (1979), Putnam (1992a), Smolensky (1992), Stillings et al. 
(1995), Strube et al. (1996, S. 303-317), Wilson & Keil (1999) 
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standen oder zu offenen Verhaltensweisen. Aus funktionalistischer Sicht sind men- 
tale Zustande folglich genau dann gleich, wenn sie gleiche Funktionen, d.h. gleiche 
Ursachen und gleiche Folgen haben. 

0 Die Freude zweier Menschen an unterschiedlichen Orten und zu unterschiedlichen Zeiten 
ist gleich, wenn sie jeweils durch eine uberraschend bestandene Klausur hervorgerufen 
wurde und lautes Lachen und erhohtes Selbstwertgefuhl zur Folge hat. 

Funktionale Zustande sind immer irgendwie materiell realisiert, sie sind aber nicht 
identisch mit den physischen Zustanden, durch die sie realisiert werden. Funktionale 
Zustande sind nicht vollstandig auf materielle zu reduzieren, zumindest sind 
funktionale Beschreibungen nicht vollstandig durch materielle (physiologische oder 
biochemische) Beschreibungen zu ersetzen. 

Multiple Instantiierbarkeit 

• • 

Trotz aller Ahnlichkeiten, die zwischen Mensch und Computer auf der Verarbei- 
tungsebene ( Software ) bestehen, sind die materiellen Ebenen ( Hardware ) natiirlich 
verschieden: Wahrend beim Menschen die materielle Ebene ein biologisches System 
mit Neuronen und Synapsen ist, ist sie beim Computer ein physikalisches System mit 
Speicherelementen und Verdrahtungen. 

Jeder mentale Zustand ist multipel instantiierbar, das heiBt er kann in 
unterschiedlichen physischen Zustanden und Systemen realisiert sein. Menschen, 
Tiere und Computer konnen sich daher im gleichen mentalen Zustand befinden . 132 

0 Ein manuskriptlesender Mensch und ein textverarbeitender Computer konnen funktional 
im gleichen mentalen Zustand „Rechtschreibprtifung durchfiihren“ sein, obwohl sich ihre 
materiellen Zustande massiv unterscheiden. 

0 Dietrich Domer hat in seine Programme zur Simulation menschlichen Handelns auch 
Komponenten aufgenommen, die die gleiche Funktion haben wie Emotionen. Ein 
Computer, auf dem dieses Programm ausgefuhrt wird, und ein Mensch konnen daher 
beispielsweise nach erfolgreichen Problemlosungen beide im Zustand „stolz“ sein. 

Versteht man den Funktionalismus konsequent instrumentalistisch, sind Gefiihle, 
Absichten und andere mentale Zustande abstrakte Attribute, die Systemen zuge- 
schrieben werden, um ihr Verhalten zu erklaren. Absichten konnen dann nicht nur 

1 Q A 

Menschen, sondern auch Tieren und technischen Systemen zugeschrieben werden. 

0 Wenn eine Person ein Heizkorperventil aufdreht, erklaren wir dies dadurch, dass sie die 
Temperatur im Raum erhohen will, weil es ihr zu kalt ist. Wir schreiben ihr also eine 
Wahrnehmung („zu kalt“) und eine Absicht („Temperatur erhohen“) zu. Nach 



132 

kritisch zur multiplen Realisierbarkeit: Bechtel & Mundace (1999) 

133 Dorner (1999), vgl. Frijda & Swagerman (1987) 

134 Dennett (1987, 1988), Bieri (1987). Ob Tiere mentale Zustande und Bewusstsein haben 
konnen, ist fur nicht funktionalistisch orientierte Autoren eine offene empirische Frage 
(Davidson, 1999; Heyes, 1998; Stephan, 1999). 
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Auffassung von Daniel Dennett konnen wir die gleichen Zustande auch einem 
Thermostat zuschreiben, das am Heizkorper angebracht ist und ebenfalls das Ventil 
offnet, weil die tatsachliche Temperatur unterhalb der eingestellten liegt. 

Probleme 

Ein wesentlicher Einwand gegen den Funktionalismus besteht darin, dass er, ahnlich 
wie der eliminative Materialismus, die Qualitat des subjektiven Erlebens sowie be- 
sonders das Verstehen und Erfassen von Bedeutungen unberiicksichtigt lasst. 

0 Nehmen wir an, wir haben alle Funktionen im Wahmehmungssystem einer Fledermaus 
vollstandig beschrieben und verstanden. Wir konnen trotzdem eine einfache Frage nicht 

beantworten: Wie empfindet man, wenn man die Umwelt nur durch ihr sonares Ortungs- 

135 

system wahrnimmt? Oder kurz: Wie ist es, eine Fledermaus zu sein? 

0 Ein Amerikaner ohne Fremdsprachenkenntnisse sitzt in einem vollstandig abgeschirmten 
Zimmer in einem Restaurant in Tokio und muss die japanischen Bestellzettel der Kellner 
in chinesische Anweisungen fur die Kliche iibertragen. Dazu werden ihm genaue und 
ausreichende Ubersetzungsregeln vorgegeben. Er kann seine Ubersetzungsaufgabe 
perfekt erflillen, ohne jemals die Bestellungen wirklich zu verstehen. 136 

Ungeklart bleibt beim Funktionalismus auch, in welcher Beziehung die (funktional 
charakterisierten) mentalen Zustande zu den materiellen Zustanden stehen, in denen 
sie realisiert werden. Deshalb haben Fodor und Putnam ihre funktionalistischen 
Positionen mit einer modifizierten Form der Identitatslehre verbunden: der Token- 

1 37 

Identity -The orie, die hier als Instanzen-Identitats-Lehre bezeichnet wird. 

Instanzen -Identitat 

Der Name Token-Identity-Theorie verweist auf die allgemeine Unterscheidung zwi- 
schen einzelnen Instanzen und umfassenden Klassen: 

• Eine Instanz (token) ist ein spezieller mentaler Zustand einer Person zu einer 
bestimmten Zeit: z.B. das aktuelle Abwagen zwischen zwei Urlaubszielen. 

• Ein Typ ist eine generelle Klasse von mentalen Zustanden (z. B. „Abwagen“). 

Diese Unterscheidung tragt der Tatsache Rechnung, dass bei genauer Betrachtung 
zwei mentale Zustande zu unterschiedlichen Zeiten, in verschiedenen Situationen 
oder gar bei verschiedenen Personen niemals vollstandig gleich sein konnen, weil 
stets spezifische Umstande zum jeweiligen mentalen Zustand beitragen. 

Verschiedene mentale Zustande konnen aber als Equivalent klassifiziert und als 
Instanzen des gleichen Zustandstyps bezeichnet werden, wenn sie sich in ihren 
wesentlichen Aspekten hinreichend ahneln. Funktionalisten benutzen als Kriterium 



Nagel (1974) 

136 nach dem Chinesischen Zimmer (Searle, 1980), Kritik: Hauser (1997) 

137 Fodor (1974), Putnam (1975), Bechtel (1988a, S. 106-110), Stillings et al. (1995, S. 
350-353) 
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fur eine derartige Klassifikation mentaler Zustande ausschlieBlich deren Funktion: 
Mentale Zustande sind gleich, wenn sie zum gleichen Funktionstyp gehoren. 

0 Wenn eine Person zu einem bestimmten Zeitpunkt Angst vor einem bestimmten Hund 
hat, ist sie in einem speziellen mentalen Zustand. Wenn sie zu einem spateren Zeitpunkt 
wiederum Angst vor einem Hund hat, ist sie in einem anderen speziellen mentalen 
Zustand. Wenn beide mentalen Zustande funktional Equivalent sind, konnen sie dem 
gleichen Zustandstyp (Angst vor Hunden) zugeordnet werden. 

Vertritt man eine starke Form der psycho-physischen Identitatslehre, wiirde man 
annehmen, dass sowohl die speziellen wie die generellen mentalen Zustande 
identisch mit speziellen bzw. generellen physischen Zustanden sind ( type-identity 
theory). Der mentale Zustandstyp der Angst vor Hunden etwa ware identisch mit 
einem bestimmten Zustandstyp des neuronalen und physiologischen Systems. 

Die Instanzen-Identitats-Lehre nimmt eine Identitat hingegen nur fur spezielle 
Instanzen an, nicht fur die generellen Zustandstypen: 

• Jede spezielle Instanz eines mentales Zustands (token) ist identisch mit einem 
speziellen physischen Zustands des Organismus, aber: 

• kein genereller Typ von mentalen Zustanden (type) ist identisch mit einem 
bestimmten Typ von physischen Zustanden (und umgekehrt). 

Auch neurophysiologische Zustande zu unterschiedlichen Zeiten und Personen sind 
nie vollstandig gleich und lassen sich unterschiedlich klassifizieren. Grundsatzlich 
ware es moglich, dass eine psychologisch sinnvolle Zusammenfassung von mentalen 
Zustanden eindeutig einer sinnvollen neurophysiologischen Klassenbildung ent- 
spricht. Nach der Instanzen-Identitats-Fehre muss eine derartige Korrespondenz aber 
nicht existieren. Fur psychologisch aquivalente Zustande muss nicht immer auch 
eine neurophysiologische Aquivalenz auffindbar sein. GesetzmaBige 
Zusammenhange zwischen psychologischen Zustanden sind deshalb nicht immer auf 
der neurophysiologischen Ebene wiederzufinden. 

In der Abbildung 2.3 ist diese funktionalistische Instanzen-Identitats-Auffassung 
veranschaulicht. 138 Dort sind zwei mentale Zustandstypen M t und M 2 eingezeichnet, 
die kausal miteinander verbunden sind: Tritt ein spezieller mentaler Zustand aus 
ein, zieht dies einen der speziellen Zustande aus M 2 nach sich. Jeder der speziellen 
mentalen Zustande ist identisch mit einem speziellen physischen Zustand. Die 
physischen Realisierungen von M , und M 2 gehoren jedoch nicht unbedingt zu zwei 
physischen Zustandstypen Pi und P 2 , die durch ein Kausalgesetz miteinander 
verbunden sind. Vielmehr sind nur einige der physischen Realisierungen von M! 
kausal mit physischen Realisierungen von M 2 verbunden. Deshalb ist auf der 
physischen Ebene die kausale Verbindung, die voraussetzungsgemaB zwischen den 
mentalen Zustanden besteht, nicht erkennbar. 



138 



in Anlehnung an Fodor (1974, 1975) und Carrier & MittelstraB (1989, S. 76) 
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Funktionalismus : 
Instanzen-Identitat 
( token identiy ) 
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Abbildung 2.3: Veranschaulichung der Instanzen-Identitats-Theorie 

0 Mj ist die Wahrnehmung des Regens, M2 der Entschluss zur Flucht. Beide Zustandstypen 
sind kausal miteinander verbunden: Tritt einer der speziellen Wahmehmungszustande 
mu bis mi3 auf, zieht dies einen der speziellen Entschlusszustande m2i bis ni24 nach sich. 
Die Zustande mu und m^ konnen reale Wahrnehmungen zu unterschiedlichen Zeiten 
sein, mi3 kann z.B. die Wahrnehmung wahrend eines Traums sein. Die zugehorigen 
neurophysiologischen Zustande konnen unterschiedliche kausale Verkntipfungen 
besitzen. Beispielsweise konnen pn und P12 gesetzesmaBig mit kortikalen Zustanden 
verbunden sein, die Entschlusszustanden entsprechen, P13 aber nicht. 

Nach der funktionalistischen Instanzen-Identitats-Lehre sind mentale Gesetz- 
maBigkeiten also in gewissem Sinne unabhangig von physischen GesetzmaBigkeiten. 
Deshalb sind psychologische und besonders kognitionspsychologische Begriffe und 
Gesetze nicht vollstandig durch neurobiologische Begriffe und Gesetze ersetzbar. 

Dies gilt allerdings nur fur Begriffe und Aussagen, die sich auf mentale Zustands- 
typen beziehen. Psychologische Begriffe und Aussagen iiber einzelne Instanzen 
mentaler Zustande dagegen konnten eliminiert werden, da sie per definitionem mit 
physischen Zustanden gleichgesetzt werden. Aber ist diese Annahme einer Identitat 
zwischen (speziellen) mentalen und physischen Zustanden sachgerecht? Ist die 
daraus folgende (teilweise) Reduktion von Psychologie auf Neurobiologie sinnvoll? 
Skeptische Fragen dieser Art haben zum nicht-reduktiven Physikalismus gefiihrt. 

2.2A.2 Nicht-reduktiver Physikalismus: Emergenz und Supervenienz 

In wissenschaftlichen Arbeiten zur Leib-Seele-Thematik bestreitet inzwischen kaum 
noch jemand ernsthaft, dass mentale Zustande irgendwie auf physischen Zustanden 
beruhen. In diesem Sinn sind die meisten Vertreter der Philosophie des Geistes 
Materialisten oder Physikalisten. Auch Funktionalisten zahlen dazu, denn fiir sie 
muss jeder mentale Zustand auf irgendeine Weise materiell instantiiert sein. 
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Etliche Materialisten oder Physikalisten sind jedoch keine Reduktionisten. Fur sie 
muss noch etwas hinzukommen, damit aus einem physischen Zustand ein mentaler 
wird. Diese Vorstellung schlagt sich in Kombinationen von dualistischen und 
monistischen Sichtweisen nieder, die je nach erkenntnistheoretischer Grundposition 
unterschiedlich akzentuiert und benannt sind: als Dualismus, der auf Eigenschaften 
beschrankt ist, bzw. als Physikalismus, der nicht-reduktiv ist . 139 

Eigenschaftsdualism us 

Innerhalb der dualistischen Positionen zur Leib-Seele-Beziehung sind zwei grund- 
satzliche Auspragungen moglich. Descartes und andere Vertreter eines starken Sub- 
stanzdualismus nehmen an, dass es neben physischen auch nicht-physische, mentale 
Objekte gibt. Der Eigenschaftsdualismus beinhaltet schwachere Annahmen: 

• Es gibt nur eine Art von Substanzen, namlich korperliche Objekte. 

• Diese korperlichen Objekte konnen aber zwei Arten von Eigenschaften haben: 
materielle und geistige. 

Jeder physisch existente Mensch kann demnach zu jedem Zeitpunkt verschiedene 
korperliche und verschiedene mentale Eigenschaften haben, das heiBt, er kann in 
verschiedenen korperlichen und in verschiedenen mentalen Zustanden sein. 

0 Ein Autofahrer im Verkehrsstau hat sowohl bestimmte mentale Zustande (wie seine 
Wahrnehmung der roten Ampel, seine Wut, seine Versuche, sich eine Ausweichstrecke 
auszudenken) als auch bestimmte korperliche Zustande (vom schnellen Puls bis zur 
Aktivation von bestimmten Neuronengruppen im visuellen und prafrontalen Kortex). 

Von zentraler Bedeutung fur eigenschaftsdualistische und nicht-reduktiv-physikali- 
stische Beschreibungen der Beziehung zwischen Korper und Geist sind die Konzepte 
der Supervenienz und Emergenz, die im folgenden erlautert werden. 

Supervenienz 

Der Begriff der Supervenienz kennzeichnet eine Prazisierung der Vorstellung, dass 
mentale Zustande auf physischen Zustanden beruhen, aber nicht auf sie reduzierbar 
sind. Die Annahme, dass mentale Eigenschaften auf physische Eigenschaften super- 
venieren, kann man genauer wie folgt definieren: 

• Wenn zwei Objekte sich in ihren mentalen Eigenschaften unterscheiden, miissen 
sie sich auch in ihren physischen Eigenschaften unterscheiden. 

• Wenn Objekte in alien physischen Eigenschaften gleich sind, dann miissen sie 
auch in alien mentalen Eigenschaften gleich sein . 140 



Beckermann (1992), Chalmers (1996), Gadenne (1996, 1997b), Kim (1996, 1997a, 
1997b, 1998a), McDonough (1997), Meyering (1997), Scott (1995), Walter (1997) 

140 Davidson (1992). Beide Aussagen sind Equivalent ( Modus tollens, siehe Kapitel 3.4.1). 
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Es kann also keinen Unterschied zwischen mentalen ohne einen Unterschied 
zwischen materiellen Zustanden geben. Moglich ist jedoch, dass Zustande physisch 
unterschiedlich, aber mental gleich sind. 

Was die Supervenienz des Mentalen auf das Physische bedeutet, kann auf andere 
Weise noch deutlicher definiert werden. 141 

• Fur jeden mentalen Zustand M, gibt es mindestens einen physischen Zustand Py, 
so dass alle Objekte, die im Zustand Py sind, notwendigerweise auch in M s sind. 

Wir konnen uns nun erneut der erwahnten Grundfrage der Geist-Gehirn-Thematik 
zuwenden: Wie kann ein mentaler Zustand einen anderen mentalen Zustand oder gar 
einen physischen Zustand kausal beeinflussen? Widerspricht das nicht der allgemein 
akzeptierten Auffassung, dass die physikalische Welt kausal abgeschlossen ist, nicht- 
physikalische Ereignisse also keine kausalen Wirkungen haben konnen? 

0 Wie kann eine Wahrnehmung (Mi) eine Fluchtentscheidung (M 2 ) und diese ein Weglau- 
fen (P 3 ) vemrsachen? 

Unter der Supervenienzannahme kann die Frage einfach beantwortet werden: Die 
Wirkung eines mentalen Zustandes ist auf die Wirkung physischer Zustande zurlick- 
zuflihren. Dies ist in Abbildung 2.4 skizziert. 142 



Supervenienz 





Abbildung 2.4: Superveniente Beziehungen im nicht-reduktiven Physikalismus 

Der mentale Zustand Mi hat (unter anderem) die physische Basis Pi. Pi ist ursachlich 
fur P 2 , der eine Basis von M 2 ist. In diesem Fall bezeichnen wir Mi als Ursache fur 
M 2 . Um zu kennzeichnen, dass diese Kausalbeziehung eine nicht-materielle ist, wur- 
de der Pfeil in der Abbildung gestrichelt. Ist P 2 Ursache fiir eine offene Verhaltens- 
weise P 3 , bezeichnen wir auch M 2 als Ursache fiir P 3 . Mittelbar ist also auch Mi eine 
Ursache fiir P 3 . 143 



141 nach Kim (1997b, S. 272), zur probabilistischen Interpretation: Lauth (1999) 

1 49 

in Anlehnung an Gadenne (1997b) 

143 

Etliche Philosophen sprechen von Ursachen nur, wenn ein materieller Zustand einen 
anderen tatsachlich und mit Naturnotwendigkeit hervorbringt (siehe unten Kapitel 
7.2.2). Zwischen mentalen Zustanden konnen danach keine kausalen Beziehungen 
bestehen (Gadenne, 1997b). Ich fasse unter den Begriff der Ursache hier auch gesetz- 
maBige Beziehungen zwischen mentalen sowie zwischen mentalen und physischen 
Zustanden (vgl. Pietroski, 1994). 
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0 Eine Abiturientin best, dass man sich im Psychologiestudium auch mit Statistik 
beschaftigen muss. Sie zerreiBt daraufhin ihren Zulassungsantrag. Betrachten wir die 
Information Mi als nicht-materielle Ursache fur das ZerreiBen P 3 , bedeutet dies: Die 
Person hat neues Wissen erworben, befindet sich also in einem neuen mentalen Zustand 
Mi. Nach der Supervenienzannahme muss dieser Veranderung eine physische 
Veranderung Pi entsprechen. Dieses Ereignis kann im materiellen Sinn Ursache fur ein 
Ereignis P 2 sein, der einem Entschluss (M 2 ) entspricht und das physische ZerreiBen P 3 
verursacht. 

Die Annahme einer Supervenienz reicht noch nicht aus, um die Beziehung zwischen 
mentalen und physischen Zustanden adaquat zu beschreiben . 144 Sie ist eine gute Pra- 
zisierung der Vorstellung, dass mentale Zustande auf physischen Zustanden basieren. 
Ursprtinglich sollte mit dem Konzept der Supervenienz aber ausgedrtickt werden, 
dass psychische Zustande nicht vollstandig auf physische Zustande reduziert werden 
konnen . 145 Wie wir im folgenden noch sehen werden, muss dazu auch noch 
angenommen werden, dass mentale Zustande emergente Zustande sind. 

Emergenz 

Man bezeichnet eine Eigenschaft eines ganzen Systems als emergent, wenn sie sich 
nicht eindeutig aus den Eigenschaften seiner Teile ergibt. 

Die in der Wissenschaft betrachteten Systeme (Objekte, Sachverhalte, Beziehun- 
gen usw.) sind hierarchisch geordnet: Jedes System setzt sich aus verschiedenen 
Teilsystemen (Bestandteile, Komponenten, Faktoren usw.) zusammen, und jedes 
System ist mit anderen Systemen zusammen Teil eines ubergeordneten Systems . 146 

0 Betrachten wir eine Familie als ein System, konnen wir als Teilsysteme die Eltern-, 
Kinder- und GroBelterngeneration unterscheiden (aber auch z.B. die Manner und die 
Frauen, die Beschaftigten und Unbeschaftigten usw.). Gleichzeitig ist die Familie ein 
Teilsystem ubergeordneter Systeme (Nachbarschaft, Kirchengemeinde usw.). 

0 Das psychische System einer Person kann in Teilsysteme der Wahrnehmung, des 
Gedachtnisses, der Motivation, der Emotion usw. aufgespalten werden. 

0 Im Teilsystem der visuellen Wahrnehmung gibt es Untersysteme wie die retinalen 
Rezeptoren, die subkortikalen Detektoren und die kortikalen Felder. 



144 Die Supervenienz sagt noch nichts liber die Art der Beziehung zwischen mentalen und 
physischen Zustanden aus. Es kann sich um eine gesetzmaBige Kovariation oder eine 
kausale Beziehung handeln, es kann sein, dass die mentalen vollstandig auf die 
physischen Zustande reduzierbar sind, die Supervenienzannahme ist aber auch mit dem 
Parallelismus und dem Epiphanomenalismus vertraglich (Beckermann, 1996a, 1997a). 

145 Das Wort supervenience ist missverstandlich, weil es diese beiden Bedeutungsaspekte 
umfasst: nicht nur das Folgen oder Sich-Ergeben, sondern auch das dartiber hinaus oder 
unvermutete Hinzukommen (Horgan, 1993; MittelstraB, 1996, S. 144). Im Deutschen 
wird daher sowohl von Supervenienz iiber als auch von Supervenienz auf gesprochen. 

146 Bunge (1997, S. 414-420) 
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In jedem Fall kann ein System als Ganzes in einem Zustand sein oder Eigenschaften 
haben, die keinem der Teilsysteme sinnvollerweise zukommen konnen. 

0 „Sich streiten“ ist ein Zustand, in dem sich ein System aus mindestens zwei Personen 
befinden kann, aber keine einzelne Person. 

0 Die Wahmehmung einer Ampel kann ein Zustand des ganzen Menschen oder seines 
zentralen Nervensystems sein, sie ist aber kein moglicher Zustand einzelner Nerven- 
zellen. 

0 Wasser hat Eigenschaften, die keines der t^O-Molektile hat, aus denen es besteht: Es ist 
flussig oder gefroren, heiB oder kalt usf. 

Der Begriff der Emergenz bezieht sich auf die Frage, wie eine Eigenschaft eines 
Systems von den Eigenschaften der Teilsysteme abhangt. 

Wenn es moglich ist, den Zustand oder die Eigenschaft Z eines Systems 
vollstandig durch die Zustande oder Eigenschaften von untergeordneten Teil- 
systemen zu erklaren und vorherzusagen, ist die Eigenschaft Z reduzierbar. Ist 
hingegen eine vollstandige Reduktion auf Eigenschaften von Teilsystemen nicht 

1 47 

moglich, handelt es sich um eine emergente Eigenschaft: 

• Eine Eigenschaft eines Systems ist emergent, wenn sie sich nicht gesetzmaBig aus 
seinen Teilsystemen, ihren Eigenschaften und ihrem Zusammenwirken ergibt. 

Streng genommen ist eine Eigenschaft eines Systems nur dann emergent, wenn es 
noch nicht einmal im Prinzip moglich ist, sie aus den Eigenschaften der Teilsysteme 
abzuleiten. Ob dies der Fall ist, wird man tatsachlich nie sicher wissen konnen. 
Deshalb bezeichnet man eine Eigenschaft oft auch schon dann als emergent, wenn es 
nach dem gegenwartigen Wissen praktisch unmoglich ist, sie aus Teilsystem- 
eigenschaften abzuleiten. Dies ist insbesondere bei nicht-linearen Systemen der Fall, 
die auch als „chaotische“ Systeme bezeichnet werden: komplexe dynamische 
Systeme, bei denen die Gesamtwirkung der Teilsysteme sich nicht additiv aus ihrer 
Einzelwirkung ergibt. 148 

0 Ob aus einem bestimmten Tiefdruckgebiet iiber dem Nordatlantik eine Sturmflut entsteht, 
die die Deichkronen im Hamburger Hafengebiet iiberschreitet, ist selbst mit nicht- 
linearen Gleichungssystemen und Supercomputern nur unvollkommen vorherzusagen. 
Eine Sturmflut kann deshalb als ein emergentes Ereignis betrachtet werden. 

In der Gestaltpsychologie werden die zusatzlichen und emergenten Eigenschaften 
des Ganzen als Gestaltqualitdten bezeichnet. Bereits bei der Wahmehmung einfa- 
cher Figuren ergeben sich die Eigenschaften des Ganzen nicht aus der Summe der 
Eigenschaften seiner Teile. Umgekehrt konnen die Eigenschaften des Ganzen erhal- 
ten bleiben, auch wenn sich alle Teile verandern. 149 



Beckermann (1992, 1997b) 
Scott (1995, S. 4-5, 189-190) 
Metzger (1975), Gordon (1989) 
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0 Eine Melodie ist mehr als die Summe ihrer Tone, und sie bleibt gleich, auch wenn alle 
Tone um eine Oktave transponiert werden. 

Dementsprechend beschaftigen sich auch andere Wissenschaften mit Systemen, die 
auf unterschiedlichen Ebenen liegen und emergente Eigenschaften haben konnen. 

0 Eine soziale Marktwirtschaft zu sein, ist eine mogliche Eigenschaft von Staaten oder 
Wirtschaftssystemen, die sich nicht aus den Eigenschaften der beteiligten Betriebe 
ableiten lasst. Ein Unternehmen kann eine „flache Hierarchie“ haben, ohne dass sich dies 
eindeutig aus Eigenschaften einzelner Mitglieder der Belegschaft ergibt. 

Betrachten wir mentale Zustande als emergent, bedeutet dies: 

• Aus den Eigenschaften neuronaler Zustande und den neurobiologischen Gesetzen 
lassen sich nicht alle Eigenschaften mentaler Zustande erklaren und vorhersagen. 

Das Geistige ist danach eine Eigenschaft des Gehirns auf einer hoheren als der neu- 
ronalen Beschreibungsebene. Die mentalen Eigenschaften werden zwar durch neu- 
robiologische Strukturen und Prozesse erzeugt, das Mentale geht aber insofern iiber 
das Materielle hinaus, als es nicht vollstandig und eindeutig aus ihm ableitbar ist. 150 
Ein mentaler Zustand kann nicht allein aus neuronalen Geschehnissen erklart wer- 
den, zu beriicksichtigen sind auch die Beziehungen zu anderen mentalen Zustanden. 

M 1+ l 

Mi#/ 

Nichtreduktiver Physikalismus: | 

Supervenienz und Emergenz P ( 

Abbildung 2.5: Superveniente und emergente Beziehungen 

In der Abbildung 2.5 werden diese Vorstellungen dadurch veranschaulicht, dass die 
physisch erklarbaren Bestandteile mentaler Zustande (Mi# und M 2 #) von den nicht- 
erklarbaren Bestandteilen (Mi + und M 2 +) getrennt werden. 

Zusammenfassende Abschlussbemerkungen 

Die Darstellung verschiedener Positionen zur Leib-Seele-Beziehung kann aus 
mehreren Griinden nicht mit einer endgiiltigen Losung abschlieBen. Die Philosophic 
des Geistes ist keine empirische Wissenschaft. Wir konnen von ihr deshalb keine 




Putnam (1997, S. 30), Scott (1995, S. 159-175), Searle (1992, 1997, S. 235), Brtintrup 
(1998), Davidson (1999). Searle ubertragt die emergente Beziehung zwischen Geistigem 
und Materiellen auf die Beziehung zwischen dem Sozialen und dem Materiellen: Auch 
die Eigenschaften und Zustande sozialer und kultureller Systeme konnen iiber ihre 
materiellen Eigenschaften hinausgehen, ohne dass es einen Bmch zwischen Kultur und 
Biologie geben muss. 
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Antwort auf die empirische Frage erwarten, wie die Beziehungen zwischen Korper 

und Psyche, zwischen Geist und Gehirn tatsachlich sind. 

• • 

Die Uberlegungen in der Philosophic des Geistes konnen uns aber anregen und 
warnen. Sie zeigen, welche Beziehungen zwischen Korper und Geist prinzipiell 
bestehen konnen. Sie warnen davor, in Wissenschaft und Praxis allzu schnell und 
unbegrlindet eine zu einfache Leib-Seele-Beziehung zu unterstellen. 

Einerseits finden sich zu einfache dualistische Sichtweisen. Es wird angenommen, 
dass psychische Ereignisse korperliche Vorgange beeinflussen, obwohl nicht erklart 
werden kann, wie etwas Immaterielles etwas Materielles hervorruft. Auf der anderen 
Seite wird haufig ein unreflektierter Reduktionismus vertreten, obwohl nicht sicher 
ist, ob es jemals moglich sein wird, alle propositionalen Einstellungen und Erlebnis- 
qualitaten befriedigend durch Gehimzustande zu erklaren. 

Falls man zu einem spateren Zeitpunkt aufgrund der Ergebnisse der neuro- 
biologischen Forschung tatsachlich die mentalen Erlebnisse einer Person vollstandig 
und gesetzmaBig aus ihren physiologischen und neuronalen Zustanden und 
Prozessen ableiten kann, ist das Geistige vollstandig auf das Korperliche reduzierbar. 
Gegenwartig sind Neurobiologie und Neuropsychologie von diesem Ziel noch sehr 
weit entfernt. 151 Solange es zumindest einige Aspekte des Erlebens gibt, die nicht aus 
den materiellen Geschehnissen ableitbar sind, miissen wir mentale und physische 
Zustande unterschiedlich beschreiben und erklaren. 

Gegenwartig erscheint es mir am sinnvollsten, mentale und physische Zustande 
als unterschiedliche Eigenschaften von Systemen aufzufassen, die zueinander 
komplementar sind und auf unterschiedlichen Betrachtungsebenen deutlich werden. 

0 GenieBt eine Person den Biss in eine reife gelbe Birne, ist dies ein komplexer mentaler 
Systemzustand. Gleichzeitig befindet sich diese Person in einem komplexen physischen 
Zustand, zu dem unter anderem die momentanen Aktivitaten der Farb-, Geruchs- und 
Geschmackssensorsysteme gehoren. 

Sollen mentale Zustande nicht losgelost von der Materie existieren, miissen wir 
auBerdem annehmen, dass sie supervenient sind. 

0 Ein momentanes Geruchserlebnis M superveniert auf den momentanen Zustand P des 
Geruchssystems (von den Rezeptoren bis zu den kortikalen Projektionsfeldern), wenn alle 
Personen (oder die Person zu alien Zeiten), bei denen das Geruchssystem in genau diesem 
Zustand ist, notwendigerweise genau dieses Geruchserlebnis haben. 

Sollen mentale Zustande eine materielle Basis haben, aber nicht auf Materielles 
reduzierbar sein, miissen sie nicht nur supervenient, sondern auch emergent sein. 

0 Das Geruchserlebnis M ist ein emergenter Zustand, wenn er mindestens eine Eigenschaft 
hat, die nicht aus dem physischen Zustand P des Gemchssystems und den fur diesen 
materiellen Bereich geltenden Gesetzen ableitbar ist. 



151 



Einen sehr guten Uberblick bietet der Band von Roth und Prinz (1996). 
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Die philosophischen Positionen zum Leib-Seele-Problem werden meist als 
ontologische Hypothesen aufgefasst, d.h. Annahmen liber das Sein, die Existenz und 
die Realitat bestimmter Dinge. Sie sind nur dann von Interesse, falls wir wissen- 
schaftliche Aussagen liber eine von uns unabhangig bestehende Realitat machen 
wollen. Von einem idealistischen und instrumentalistischen Standpunkt hingegen 
reduziert sich das Leib-Seele-Problem auf eine Frage der wissenschaftlichen Sprache 
und Begrifflichkeit. Die Aufgabe besteht aus dieser Sicht darin, die verschiedenen 
Begrifflichkeiten, die zur Beschreibung mentaler und physischer Phanomene 
notwendig sind, sinnvoll zu verbinden . 152 



152 

Nach Wittgenstein (1953) und Ryle (1969) stammen Aussagen liber physische und 
mentale Zustande aus verschiedenen „Sprachspielen 44 , deren Vermengung zu sog. 
Kategorienfehlern flihrt (Bieri, 1987; Hastedt, 1989, S. 93-106; Herrmann, 1983). 
Dieser Sprachdualismus ist aber kein Hindernis, unterschiedliche Arten von Begriffen 
und Theorien systematise!! zu verbinden (siehe unten Kapitel 11.6). 





3 Prazisierungen durch Logik 



In der Wissenschaft benutzen wir die Sprache, um unsere Fragen und Antworten, 
Ausgangspunkte und Ziele, Vermutungen und Ergebnisse festzuhalten und 
mitzuteilen. Diese sprachlichen Mitteilungen richten sich an Kollegen aus dem 
gleichen Fachgebiet, an Studenten, an Wissenschaftler aus anderen Bereichen, 
mitunter auch an Laien ohne jede wissenschaftliche Ausbildung. Diese sprachlichen 
Produkte der Wissenschaften bestehen im wesentlichen aus Begriffen, Aussagen und 
Argumenten. 

Ublicherweise werden Aussagen der Psychologie in einer Sprache formuliert, die 

etliche Fachbegriffe enthalt, sonst aber der (gehobenen) Umgangssprache entspricht. 

Diese wissenschaftliche Umgangssprache reicht jedoch nicht aus, um wissenschaft- 

• • 

liche Begriffe und AuBerungen so prazise zu gestalten, dass Unklarheiten und 
Verstandigungsprobleme auszuraumen sind. Dazu miissen wir vielmehr Hilfsmittel 
aus der Fogik und der Mathematik heranziehen. Dies wird in diesem Kapitel 3 sowie 
in den folgenden Kapiteln 4 bis 6 dargestellt. 

Die Logik ist eine formale Wissenschaft, die von Mathematikern und Philosophen 
betrieben wird. Sie ist in der griechischen Antike von Aristoteles gepragt worden. 
Die moderne Logik wurde von Gottlob Frege Ende des 19. Jahrhunderts 
begriindet. ' Sie besteht aus der Aussagenlogik (Kapitel 3.2) und der Quantoren- 
oder Pradikatenlogik (Kapitel 3.3). Das sind formale Kalklile, klinstliche Sprachen. 
Sie konnen aber auch als Idealisierungen der Umgangssprache betrachtet werden. 
Mit ihrer Hilfe konnen wir deshalb unsere alltaglichen wissenschaftlichen Begriffe 
und Aussagen prazisieren. Vor allem konnen wir priifen, ob eine Aussage zwingend 
aus einer anderen gefolgert (deduziert) werden kann (Kapitel 3.4). Dadurch werden 
verschiedene Arten von Unklarheiten reduziert, die, wie im folgenden Kapitel 3.1 
illustriert wird, in wissenschaftlichen Texten stecken konnen. 



153 

Die moderne Logik wird auch als mathematische oder symbolische Logik bezeichnet. 
Einfuhrungen: Kutschera & Breitkopf (1992), Steyer & Eid (1993, S. 297-306), 
Tugendhat & Wolf (1983), Read (1997); knappe Uberblicke: Dallmann & Elster (1991, 
S. 17-32), Reinhardt & Soeder (1978, S. 14-21), Speck (1980); Vertiefungen: Carnap 
(1968), Hilbert & Ackermann (1967), Kondakow (1978), Tarski (1977) 
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3.1 Wissenschaftliche Aussagen und Verstandigungsprobleme 

Bei der Rezeption wissenschaftlicher Aussagen und Texte konnen Verstandigungs- 
probleme und Verstandnisschwierigkeiten auf verschiedene Weise zutage treten. 
Haufig ist uns direkt bewusst, dass wir nicht verstehen, was ein Autor ausdriicken 
will. Wir bemerken vielleicht, dass der Autor von verschiedenen Lesern unter- 
schiedlich verstanden wird. Einige miissen ihn dann wohl missverstanden haben. 
Mitunter haben wir gar den Eindruck, dass einem Autor selbst nicht hinreichend klar 
ist, was er ausdriicken will. Wir konnen einen Autor aber natlirlich auch 
missverstehen, ohne dass wir dies bemerken. 

Die Verstandigungsprobleme und Verstandnisschwierigkeiten bei wissen- 
schaftlichen Tex ten konnen von unterschiedlicher Art sein. Manche Schwierigkeiten 
beruhen auf Mangel der Sprache und Darstellung. Sie lassen sich dadurch 
reduzieren, dass die Autoren Satze einfacher aufbauen, zusatzliche Erklarungen 
einschieben oder das Gesagte durch Beispiele erlautern. Andere Verstand- 
nisschwierigkeiten haben ihre Ursachen in der Schwierigkeit oder Komplexitat der 
dargestellten Thematiken. Sie lassen sich iiberwinden, wenn man sich mehrfach und 
intensiv mit dem Text auseinandersetzt, sich Vorkenntnisse aneignet oder andere 
Darstellungen liest. 

Etliche, haufig unbemerkte Verstandigungsprobleme in der wissenschaftlichen 
Kommunikation sind schwerer zu beseitigen, weil sie auf methodologische Unzu- 
langlichkeiten zuriickzuftihren sind. Einige davon werden im folgenden an Bei- 
spielen erlautert: Unklarheiten tiber die Art und den Bezug einer Aussage, liber die 
argumentative Verknlipfung zwischen Aussagen sowie liber Bedeutung und Art von 
Begriffen. 154 

• • 

(1 ) Unklarheiten tiber die Art der Aufierung 

Bei vielen wissenschaftlichen Aussagen ist unklar, ob sie Feststellungen tiber reale 
Sachverhalte oder Definitionen von Fachbegriffen sind. Bei Feststellungen ist oft 
unklar, ob sie Beobachtungen beschreiben oder theoretische Annahmen. Bei theo- 
retischen Annahmen bleibt oft offen, ob sie gut begriindet oder sehr spekulativ sind. 

0 „Die primaren Emotionen (Gltick-Freude, Trauer, Furcht, Wut, Uberraschung und Ekel) 
sind angeborene Reaktionsmuster, die in vielen Kulturen gleich ablaufen.“ 155 

Diese Aussage wirkt wie die Beschreibung eines sicheren empirischen Sachverhaltes. 
Tatsachlich besteht sie aus mehreren unklaren Bestandteilen, die auch durch den 
umgebenden Text nicht durchsichtiger werden. 

Ob und welche Basisemotionen es gibt, ist recht umstritten. 156 Wollen die Autoren 
hier die Menge der primaren Emotionen definitionsgemaB festlegen? Oder haben sich 

154 Zur Illustration muss ich Texte von Kollegen zitieren, weil man die Unklarheiten in den 
eigenen Veroffentlichungen selbst nicht zu bemerken pflegt. 

155 Birbaumer & Schmidt (1999, S. 642) 
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diese Emotionen empirisch irgendwie als primar erwiesen? Sollen genau die Emotionen 
primar genannt werden, die angeborene Reaktionsmuster sind? Oder ist es ein 
empirischer Befund, dass die genannten primaren Emotionen angeboren sind? Dann 
dlirften sie durch Erfahrung in keiner Weise modifizierbar sein. Oder sind nur bestimmte 
Komponenten biologisch vorprogrammiert? Haben Angehorige der Kulturen, in denen 
die Reaktionsmuster nicht gleich ablaufen, andere Anlagen oder pranatale Erfahrungen? 
Oder ist das Ganze nur eine grob vereinfachende Zusammenfassung der bekannten 
empirischen Befunde zur groBen inter-individuellen und -kulturellen Ubereinstimmung 
bei der Interpretation von emotionalen Gesichtsausdrlicken? 157 

(2) Unklarheiten iiberden Bezug der Aussage 

Bei den meisten wissenschaftlichen Aussagen bleibt unerwahnt, welchen Bezug oder 
Geltungsbereich sie haben sollen: Sollen sie flir alle Menschen gelten, fiir die 
meisten oder nur ftir bestimmte Alters-, Kultur- oder Sozialgruppen? 

0 „Jedes Mai, wenn eine Person glaubt, dass eine ihrer Freiheiten bedroht oder eliminiert 
worden ist, wird sie ... versuchen, ihre Freiheiten wiederzugewinnen." Soil diese 
Grundannahme der Reaktanztheorie auch fiir alle Personen in einer ostasiatischen 
Diktatur gelten? 

(3) Unklarheiten iiber die argumentative Verbindung zwischen Aussagen 

In einem Text mit (sehr) vielen wissenschaftlichen Aussagen bleibt haufig unklar, in 
welcher Beziehung die einzelnen Aussagen zueinander stehen sollen: Soli die eine 
Aussage zwingend aus der anderen folgen? Wird die eine durch die andere in 
gewisser Weise gestiitzt? Oder sind beide unabhangig voneinander? 

0 „Eine soziale Phobie, auch soziale Angst genannt, ist eine persistierende, irrationale, an 
die Gegenwart anderer Menschen gebundene Angst. Der oder die Betroffene vermeidet 
nach Moglichkeit Situationen, in denen er oder sie sich kritisch beobachtet fiihlt und 
Angst verrat oder sich unangemessen verhalten konnte.“ 159 Der erste Satz ist eine 
Definition des Begriffs der sozialen Phobie. Soil der zweite Satz aus dem ersten folgen? 
Oder werden zusatzliche Verhaltenscharakteristika von Betroffenen genannt? Sind diese 
notwendig fiir eine soziale Phobie? Oder sind sie nur typische Symptome? 

(4) Unklarheiten iiber die Bedeutung von Begriffen 

Viele Verstandigungsprobleme gehen darauf zurtick, dass die Bedeutung der 
Begriffe, die ein Autor verwendet, den Lesern nicht hinreichend klar gemacht wird. 
Welche Objekte will der Autor mit einem Begriff bezeichnen? Welche Beziehungen 
zwischen den Begriffen meint er genau? Meint er mit verschiedenen Begriffen, die er 



Schneider & Schmalt (1981), Ortony & Turner (1990), Hacker & Stapf (1998, S. 219) 
Ekman (1993), Zimbardo (1999, S. 361-362) 

Weiner (1988, S. 206) 

Davison & Neale (1996, S. 147) 
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verwendet, das Gleiche? Meint er mit einem Begriff das Gleiche wie ein anderer 
Autor? 

0 Bei der Beschreibung der Rubikontheorie benutzt Heinz Heckhausen die Begriffe 
Handlung und Handeln in verschiedenen Bedeutungen. 160 Einerseits gehoren zu einer 
Handlung alle Aktivitaten, denen die gleiche Zielvorstellung zugrunde liegt, also nicht 
nur die offenen Verhaltensweisen in der aktionalen Phase, sondern z.B. auch die 
Uberlegungen zur Auswahl eines Ziels, zur Planung der Aktivitaten und zur Bewertung 
der Verhaltensergebnisse. Andererseits wird die offene Verhaltensaktivitat wahrend der 
aktionalen Phase als „Handeln 44 bezeichnet, ihr Beginn als „Handlungsinitiierung 44 und ihr 
Ende als „Handlungsabschluss 44 . 

0 Die Umsetzung einer Intention in offene Aktivitaten hangt nach der Rubikontheorie von 
der Fiat-Tendenz ab. Explizit definiert wird sie nicht. „Die Starke der Fiat-Tendenz ist ... 
von der Starke der Zielintention ... abhangig. ... Weitere Determinanten konnen die 
Dringlichkeit, die Anzahl verpasster Gelegenheiten und missgltickter Realisierungs- 
versuche einer Zielintention sein.“ 161 Wovon die Fiat-Tendenz abhangt, bleibt damit 
unklar: Ist die Motivations- oder die Volitionsstarke gemeint, die nach der Theorie beide 
mit jeder Zielintention verbunden sind? Sollen die anderen Determinanten die Fiat- 
Tendenz erhohen oder verringern? 

(5) Unklarheiten iiber die Art der Begriffe 

Bezeichnet ein Begriff, der in einem wissenschaftlichen Text verwendet wird, eine 
Menge von Elementen oder die einzelnen Elemente? Bezeichnet er Systeme oder 
Bestandteile, Eigenschaften oder Beziehungen? 

0 „Sprache stellt ein hierarchisch gegliedertes Kommunikationssystem dar, das aus 
Sprachlauten (Phonemen), Worteinheiten (Morphemen) und Satzeinheiten (Phrasen) 
besteht und mit Hilfe der Syntax (Reihenfolge von Worten) zu Propositionen (Bedeu- 
tungseinheiten) und Satzen zusammengefasst wird.“ 162 

Nach dieser Charakterisierung sind Phoneme, Morpheme und Phrasen Bestandteile 
der Sprache. Dieses Kommunikationssystem besteht also (zumindest) aus drei Grund- 
mengen. Doch wie kann man das ganze System zu Propositionen und Satzen zusammen- 
fassen? Gemeint ist wohl, dass die Grundmengen kombiniert werden. Ist die Syntax dabei 
eine auBenstehende Instanz, die zu Hilfe genommen werden kann? Die Syntax ist doch 
auch ein Bestandteil des Systems Sprache: eine Relation, die anzeigt, ob eine Wortreihen- 
folge „erlaubt“ ist. Auch die Worter, Propositionen und Satze mussten Bestandteile des 
Systems sein. Dem entgegen steht jedoch die Aussage „Sprache ist in Bedeutungs- 
einheiten (Propositionen) reprasentiert 44 . 163 Das klingt so, als ob Sprache und Pro- 
positionen zwei verschiedene Systeme sind, die aufeinander abgebildet werden. Oder 
wird das System Sprache nur durch einen seiner Bestandteile reprasentiert? 



Heckhausen (1989, S. 14-15, 212-216) 
Heckhausen (1989, S. 214) 

Birbaumer & Schmidt (1999, S. 675) 
Birbaumer & Schmidt (1999, S. 676) 





Prazisierungen durch Logik 



69 



Derartige Unklarheiten und Verstandigungsprobleme sind nur zu vermeiden, wenn 

wir wissenschaftliche Aussagen praziser formulieren als alltagliche Aussagen. 164 

• • 

Wir mtissen jedoch nicht alle psychologischen AuBerungen in mathematische 
oder logische Formeln umsetzen. Wir konnen weiterhin die wissenschaftliche 
Umgangssprache benutzen. Wir sollten aber bereit und fahig sein, unsere Begriffe 
und Aussagen mit Hilfe logischer und mathematischer Konzepte zu prazisieren, falls 
dies notwendig ist. Dies kann helfen, Fehler und Missverstandnisse in 
wissenschaftlichen Darstellungen zu vermeiden. 

Uberblick 

Mit Aussagen, die wahr oder falsch sein konnen (siehe den ersten der obigen 
Punkte), beschaftigt sich die sog. Aussagenlogik (Kapitel 3.2). Wesentlich sind dabei 
vor allem die Verkntipfungen von Aussagen, die sog. Junktoren. 165 Die Quantoren- 
logik beschreibt, wie Aussagen aus Subjekten und Pradikaten aufgebaut sind 
(Kapitel 3.3). Durch Variablen und Quantoren konnen die Bezugsobjekte einer 
Aussage (Punkt 2) deutlicher angegeben werden. 

Wie im dritten Punkt angedeutet, sind wissenschaftliche Aussagen in der Regel 
argumentativ miteinander verbunden: Das Kapitel 3.4 beschaftigt sich mit der 
korrekten logischen Deduktion von Aussagen aus vorgegebenen anderen Aussagen. 
Wesentliche Aspekte des wissenschaftlichen Denkens und Argumentierens entspre- 
chen allerdings nicht deduktiv-logischen Schlussen, sondern stellen ubertragende 
oder verallgemeinernde Argumente dar. Die Rechtfertigung dieser induktiven 
Argumente wird im Kapitel 4 besprochen. 

Der Definition wissenschaftlicher Begriffe (Punkt 4) wenden wir uns im Kapitel 5 
zu. Die Bedeutung psychologischer Begriffe kann man zwar auf verschiedene Weise 
prazisieren, meist verbleibt aber noch eine gewisse Vagheit. Stets moglich und 
empfehlenswert ist es, die Art der verwendeten wissenschaftlichen Begriffe (Punkt 
5) in der Sprache der Mengentheorie zu charakterisieren (Kapitel 6). 



3.2 Aussagenlogik 

3.2.1 Aussagen und Wahrheitswerte 

• Seit Aristoteles versteht man unter einer Aussage etwas, von dem man sinn- 
vollerweise sagen kann, dass es wahr oder falsch ist. 166 



Opp (1976), Gadenne (1994b) 

1 65 1 1 

Der Unterschied zwischen Beobachtungsaussagen und theoretischen Aussagen wird erst 
spater behandelt, ebenso die empirische Fundierung von wissenschaftlichen Aussagen. 

166 In der Logik werden Aussagen auch als Satze bezeichnet. In den Sprach- und 
Kognitionswissenschaften bezeichnet man die kleinstmoglichen Einheiten, die entweder 
wahr oder falsch sein konnen, als Propositionen. Jede Proposition kann dabei in 
unterschiedlichen sprachlichen Aussagen formuliert werden. 
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Es kommt nicht darauf an, ob die Wahrheit oder Falschheit bekannt ist oder wie man 
sie feststellen kann. 

0 „Sigmund Freud hat am 6.6.1866 Lateinunterricht gehabt“ ist eine Aussage, denn sie ist 
entweder wahr oder falsch. Wir wissen aber nicht, welchen Wahrheitswert sie hat, und 
wir konnen ihren Wahrheitswert heute auch nicht mehr eindeutig feststellen. 

Werden zwei oder mehr Aussagen verkniipft (durch „und“, „oder“, „wenn, dann“ 
usw.), entsteht eine neue, zusammengesetzte Aussage. Eine Aussage, die nicht 
zusammengesetzt ist, ist eine elementare Aussage. 

6 Elementare Aussagen sind: „7 ist eine gerade Zahl“, „Alfred Adler war ein Schuler von 
Sigmund Freud“, „Berlin ist die Hauptstadt Deutschlands“, „ Berlin liegt an der Elbe“. 

6 Zusammengesetze Aussagen sind: „Berlin ist die Hauptstadt Deutschlands und liegt an 
der Elbe“, „Wenn 7 eine gerade Zahl ist, dann ist sie ohne Rest durch 2 teilbar“. 

Keine Aussagen sind dagegen alle sprachlichen oder mathematischen Ausdrlicke, die 
nicht wahr oder falsch sein konnen. 

6 Ausdrlicke, die keine Aussagen sind: „Die Zahl 7 ist kleiner“, „Guten Abend allerseits!“, 
„War Sigmund Freud neurotisch?“, „x + 5 < 20“, „Alfred Adler R Sigmund Freud.“ 

Die letzten beiden Ausdriicke sind Beispiele fur sog. Aussageformen : Sie werden zu 
(wahren oder falschen) Aussagen, indem man fur x eine bestimmte Zahl (z.B. x = 
10) bzw. fur R eine bestimme Relation (z.B. „war Schuler von“) einsetzt. 

Voraussetzungen und Grenzen 

Die Aussagenlogik ist eine zweiwertige Logik. Es gibt nur die Wahrheitswerte 
„wahr“ und „falsch“. Um die Aussagenlogik anwenden zu konnen, muss fur jede 
elementare Aussage eindeutig festgelegt werden, ob sie wahr oder falsch ist. 

0 Die Aussage eines Prtiflings „Sigmund Freud ist 1855 geboren“ ist, da Freud tatsachlich 
1856 geboren wurde, streng genommen falsch. 

Die Wahl des Kriteriums fitr die Wahrheit einer Aussage ist keine logische, sondern 
eine inhaltliche Aufgabe. Wenn fur jede Aussage eindeutig festgelegt wird, ob sie 
wahr oder falsch ist, kann die Aussagenlogik angewendet werden, unabhangig 
davon, wie diese Festlegung erfolgt. 

0 Ein Priifer kann streng sein und nur die Aussage „Sigmund Freud wurde 1856 geboren 11 
als wahr betrachten. Er kann aber auch groGziigiger sein und beispielsweise festlegen, 
dass alle Aussagen mit Geburtsjahren zwischen 1850 und 1859 wahr sind. 

Verschiedene Abstufungen oder Grade der Wahrheit oder Falschheit von Aussagen 
konnen wir durch die zweiwertige Aussagenlogik nicht reprasentieren. Sind wir der 
Auffassung, dass uns interessierende elementare Aussagen nicht eindeutig, sondern 
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nur mehr oder minder wahr oder falsch sind, konnen wir die zweiwertige Aussagen- 
logik nicht oder nur als Annaherung anwenden. 

0 Ein Prtifer kann die Aussage „Sigmund Freud ist 1855 geboren“ als „fast richtig“ 
bewerten, zumindest ist sie „richtiger“ als beispielsweise die Angabe „1756“. 

Notation 

Als Stellvertreter fur beliebige Aussagen werden Aussagevariablen verwendet, die 
meist durch GroBbuchstaben A, B, C usw. bezeichnet werden (mitunter auch durch 
die Kleinbuchstaben p, q, r usw.). Wenn A und B zwei Aussagen sind, so bedeutet 
w(A) = W und w(B) = F, dass A den Wahrheitswert wahr und B den Wahrheitswert 
falsch hat. Die Negation oder Verneinung einer Aussage A wird mit — iA (bei 
manchen Autoren durch ~A) symbolisiert und als Non-A oder Nicht-A bezeichnet. 

3.2.2 Junktoren und Wahrheitstafeln 

In der Umgangssprache bestehen viele Aussagen und Aussageformen aus Teilen, die 
wiederum Aussagen bzw. Aussageformen sind. Als vermittelnde Worte treten 
Bindeworter (Konjunktionen) auf: und, oder, denn, weil, wahrend, solange usf. Die 
Aussagenlogik verfugt dagegen nur liber relativ wenige Verkniipfungen von zwei 
Aussagen. Im Gegensatz zur Umgangssprache ist die Bedeutung dieser Junktoren 
aber prazise festgelegt. Die vier wichtigen logischen Junktoren, ihre Symbole und 
ihre umgangssprachlichen Bezeichnungen sind in der Tabelle 3.1 dargestellt: 168 



Tabelle 3.1: Beschreibung der logischen Junktoren 



Name des Junktors 


umgangssprachliche Bezeichnung 


Symbol 


Disjunktion 


oder 


V 


Konjunktion 


und 


A 


Implikation 


wenn ..., dann ... 


-A 


• • 

Aquivalenz 


genau dann, wenn 


<-> 



1 6 V 

Die Beschrankungen der zweiwertigen Logik konnen durch andere Logiken tiber- 
wunden werden (Kondakow, 1978, S. 292-294; Kreiser, Gottwald & Stelzner, 1990; 
MittelstraB, 1995b, S. 626-702, 906-911; Regenbogen & Meyer, 1998; Stegmuller, 
1987a, S. 147-220). In mehrwertigen Logiken konnen Aussagen drei oder mehr 
mogliche Wahrheitswerte haben. In der Fuzzy Logic wird der Wahrheitswert einer 
Aussage durch eine Wahrscheinlichkeit angegeben, er kann also unendlich viele Werte 
von 0 bis 1 annehmen. Sie wird verwendet, um den tatsachlichen Umgang von 
Menschen mit Begriffszuordnungen und Aussagewahrheiten besser beschreiben zu 
konnen (Spies, 1993). In der Modallogik konnen Aussagen auch als „moglicherweise“ 
oder „notwendigerweise“ wahr oder falsch bezeichnet werden. Sie kann zur Definition 
und Analyse von Handlungen herangezogen werden (Wright, 1980). 

168 Auch die Negation — i wird in der Aussagenlogik als Junktor bezeichnet und liber eine 
Wahrheitstafel definiert: Ist A wahr, ist — A falsch; ist A falsch, ist — A wahr. 
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Die Bedeutung jedes Junktors zwischen zwei Aussagen A und B wird dadurch 
prazise definiert, dass fur ihn eine sog. Wahrheitstafel aufgestellt wird. Sie geht von 
alien moglichen Kombinationen der Wahrheit und Falschheit der Aussagen A und B 
aus: A wahr und B wahr, A wahr und B falsch, A falsch und B wahr, A falsch und B 
falsch. Fur jeden dieser vier Falle wird festgelegt, ob die Verkniipfung der beiden 
Aussagen wahr oder falsch ist. In der Tabelle 3.2 sind die Wahrheitstafeln fur die 
vier Junktoren zusammengefasst. Sie werden anschlieBend naher erlautert. 



Tabelle 3.2: Wahrheitstafeln zur Definition der Junktoren 



Wahrheitswerte 
urspriingliche Aussagen 

A B 


A vB 


Wahrheitswerte 

verknupfte Aussagen 
A a B A — > B 


AbB 


W 


W 


W 


W 


W 


w 


W 


F 


W 


F 


F 


F 


F 


W 


W 


F 


W 


F 


F 


F 


F 


F 


W 


W 



Disjunktion 

Umgangssprachlich wird die „oder“- Verbindung in zwei verschiedenen Bedeutungen 
verwendet: als ausschlieBendes Oder und als nicht-ausschlieBendes Oder. 

0 Wenn eine Lehrerin sagt „Ihr Sohn sollte Psychologie oder Biologie studieren“, meint 
sie, dass er entweder Psychologie oder Biologie studieren sollte, aber nicht beide Facher. 

0 Die Aussage „Schiiler, die in Englisch oder Mathematik keine ausreichenden Leistungen 
zeigen, sollten nicht Psychologie studieren 11 , ist so gemeint, dass auch Schuler, die in 
beiden Fachern keine ausreichenden Leistungen zeigen, das Fach nicht studieren sollten. 

In der Aussagenlogik ist die dem Oder entsprechende Disjunktion v nicht- 
ausschlieBend definiert, denn nach der obigen Wahrheitstabelle ist die Aussage „A v 
B“ auch dann wahr, wenn sowohl A als auch B wahr sind. 

In der Umgangssprache ist die Bedeutung von Aussagenverkniipfungen also nicht 
genau festgelegt, aufgrund des Inhalts der verkntipften Aussagen ist die Bedeutung 
der Verkniipfung aber fast immer klar. In der Aussagenlogik sind die Junktoren da- 
gegen genau definiert, und die Wahrheit einer Aussagenverknlipfung hangt dann 
allein von der Wahrheit der Aussagen ab, nicht von ihrem Inhalt. 

Im Unterschied zur Umgangssprache miissen logisch verknupfte Aussagen 
inhaltlich nichts miteinander zu tun haben. 

0 Ist A die Aussage „Berlin liegt an der Elbe“ und B ist die Aussage „2 mal 2 ist 4“, dann 
ist „A v B“ in der Logik nicht nur eine sinnvolle, sondern sogar eine wahre Aussage. 

Anders als in der Umgangssprache driickt die logische Oder- Verkniipfung keine 
Unsicherheit des Sprechers aus. 
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0 Es sei A die Aussage „Die Vorlesung findet Dienstag statt“ und B sei die Aussage „Die 
Vorlesung findet Mittwoch statt“. Dann ist „A v B“ eine sinnvolle und wahre Aussage, 
auch wenn ganz sicher ist, dass die Vorlesung am Mittwoch stattfindet. 

Konjunktion 

Nach der Wahrheitstafel ist die Aussage „A a B“ nur dann wahr, wenn sowohl A als 
auch B wahr sind, sonst ist sie falsch. Dies entspricht dem iiblichen Gebrauch der 
Und-Verkniipfung in der Umgangssprache. Mitunter findet sich dort das „und“ aber 
auch in einer Bedeutung, die eher dem logischen „oder“ entspricht. 

0 Die Aussage „Studenten der Biologie und Psychologic sind mit ihren Studien- 
bedingungen sehr zufrieden“ bezieht sich auf alle Studenten, die Biologie oder 
Psychologie studieren, nicht nur auf die wenigen Studenten, die beide Facher studieren. 

Implikation 

Das Hauptthema der Logik sind die Prinzipien des gultigen Schliefiens: Sie fragen 
nach den Bedingungen, unter denen die Herleitung einer Aussage B aus einer 
anderen Aussage A korrekt ist, d.h. unter denen B mit Notwendigkeit aus A folgt. 
Die wichtigste Verkniipfung zwischen Aussagen ist deshalb die Implikation. Besteht 
eine implikative Verkniipfung A — > B, sagt man „B folgt (logisch) aus A“. A ist die 
Pramisse der Implikation, B die Konklusion. 

Die Implikation ist durch die Wahrheitstafel so definiert, dass die Aussage „A — > 
B“ nur unter einer Bedingung falsch ist: Wenn A wahr und wenn B falsch ist. Anders 
ausgedrtickt heiBt dies: „Aus Wahrem kann nicht Falsches folgen“. 

0 A sei die Aussage „Petra wird geargert“, B „Petra verhalt sich aggressiv“. Die Aussage 
„A — > B“ („Wenn Petra geargert wird, dann verhalt sie sich aggressiv“) ist definitions- 
gemaB nur dann falsch, falls Petra geargert wird, sich aber nicht aggressiv verhalt. 

Das Vorliegen einer implikativen Beziehung zwischen A und B bedeutet also: Wenn 
die Aussage A wahr ist, muss zwangslaufig auch die Aussage B wahr sein. In diesem 
Punkt entspricht die aussagenlogische Implikation dem, was in Philosophic und 
Alltag seit jeher unter einer (logischen) Folgerung oder Ableitung verstanden wird: 
Die Wahrheit der Pramisse garantiert die Wahrheit der Konklusion. 

Die aussagenlogische Implikation hat allerdings auch Eigenschaften, die nicht 
unbedingt dem Alltagsverstandnis einer Wenn-dann- Aussage entsprechen. 

Erstens ist A — » B immer dann wahr, wenn A falsch ist, denn die Implikation ist 
definitionsgemaB nur dann falsch, wenn A wahr und B falsch ist. 

0 Ist die Aussage A „Petra wird geargert 11 falsch, ist die Implikation A — > B wahr, 
unabhangig davon, ob Petra sich nun aggressiv verhalt oder nicht. 

0 Ist A die Aussage „2 mal 2 ist gleich 5“, so ist fur jede beliebige Aussage X die 
Implikation A — > X aussagenlogisch wahr. 
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Zweitens miissen zwei Aussagen, zwischen denen eine Implikationsbeziehung 
besteht, inhaltlich nicht unbedingt etwas miteinander zu tun haben. 169 In der 
Umgangssprache driickt ein Wenn-dann-Satz dagegen stets ein inhaltliches 
Ursachen-, Bedingungs- oder Zeitverhaltnis aus. 

0 Die Aussage „Wenn 2 mal 2 gleich 5 ist, dann liegt Berlin an der Elbe“ ist aussagen- 
logisch sinnvoll, und sie ist, da Pramisse und Konklusion falsch sind, sogar wahr. 

Trotz dieser Divergenzen zum Vorverstandnis ist die Definition der logischen 
Implikation sinnvoll: Es gibt es keine bessere Moglichkeit, einen Junktor zu 
definieren, der das auszudriicken vermag, was man unter einer logischen Ableitung 

1 70 

oder zwingenden Folgerung versteht. Im Kapitel 3.4.1 wird dies an zwei 
besonders wichtigen Schlussformen dargestellt: dem Modus ponens und dem Modus 
tollens. 

• • 

Aquivalenz 

Zwei Aussagen A und B sind Equivalent, wenn zwischen ihnen eine Implikations- 
beziehung in beiden Richtungen besteht. A B gilt, wenn sowohl A — » B als auch 
B — » A gilt. In der Umgangssprache begegnet man entsprechenden Ausdrlicken (z.B. 
„dann und nur dann“, „genau dann wenn“) relativ selten. Wie kognitionspsycholo- 
gische Untersuchungen zeigen, werden jedoch Wenn-dann-Aussagen mitunter als 
Aquivalenzaussagen fehlinterpretiert. In der Mathematik und anderen formalen 
Wissenschaften werden Aquivalenzaussagen relativ haufig verwendet, um Begriffe 
zu definieren. Deshalb haben sich sogar eigene Abkiirzungen eingeblirgert: gdw im 
Deutschen fur „genau dann wenn“ und //f fur das englische „if and only if“. 

3.2.3 Notwendige und hinreichende Bedingungen 

• Gilt die Aussage A — » B, bezeichnet man A als hinreichende Bedingung fur B und 
B als notwendige Bedingung fur A. 

Beide Bezeichnungen ergeben sich aus der Definition der Implikation in der 
Wahrheitstafel: Wenn A wahr ist, muss auch B wahr sein, und A kann nur wahr sein, 
wenn B wahr ist. 

0 Watson und Rayner prasentierten ihrem Little Albert mehrmals ein weiBes Kaninchen 
(neutraler Stimulus, NS) zusammen mit einem lauten Gerausch (unkonditionierter 
Stimulus, UCS), das eine starke Furchtreaktion (unkonditionierte Reaktion, UCR) 

169 Aufgrund dieser beiden Eigenschaften der Implikation wurde die hier dargestellte 
moderne, mathematische Logik (oder „Logistik“) von Vertretern der klassischen Logik 
scharf kritisiert und abgelehnt (Freytag-Loringhoff, 1955). Diese traditionelle Logik 
beschaftigt sich vor allem mit den sog. Syllogismen (siehe unten Kapitel 3.4.2). 

170 Insgesamt konnen 2 4 = 16 zweistellige Verkniipfungen definiert werden (Reinhardt & 
Soeder, 1978, S. 14). Sie lassen sich jedoch alle auf die vorgestellten fiinf zuriickfiihren. 
Liier & Spada (1990, S. 222) 
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ausloste. 172 Diese mehrfache Presentation P war hinreichend fur die Ausbildung einer 

Furchtreaktion F auf das Kaninchen allein (konditionierte Reaktion, CR): P — » F. 

0 S sei die Aussage „eine Person bekommt als Kind haufig Schlage 44 , und U sei die 

Aussage „eine Person verhalt sich als Erwachsene gegentiber anderen Menschen haufig 

unterdrtickend 44 . S — > U entspricht dann der Aussage, dass Geschlagenwerden zwangs- 

laufig dazu flihrt (d.h. eine hinreichende Bedingung daflir ist), dass die Person als 

Erwachsene haufig Unterdrtickungsverhalten zeigt. Falls diese Aussage tatsachlich gilt, 

ist U eine notwendige Bedingung fur S: Wenn der Erwachsene seine Mitmenschen nicht 

unterdrlickt, ist er auch als Kind nicht haufig geschlagen worden. 

• • 

Liegt eine Aquivalenz A B vor, ist A hinreichend und notwendig fur B, und B ist 
hinreichend und notwendig fiir A. 

Bei einer Implikation A — » B kann B wahr und A falsch sein. A ist deshalb keine 
notwendige Bedingung fiir B, und B ist keine hinreichende Bedingung fiir A. 

0 Die gemeinsame Presentation P von Kaninchen und lautem Gerausch ist keine 
notwendige Bedingung fiir das Auftreten der Furchtreaktion F auf das Kaninchen. Diese 
kann z.B. auch durch eine Generalisierung entstehen. 

0 Auch wenn die Annahme S — > U gilt, ist S nicht notwendig fiir U: Eine Person kann ein 
Unterdriicker sein, auch wenn sie als Kind nicht haufig geschlagen worden ist. 

Wenn A zeitlich vor B liegt, kann eine Implikation A — > B einer Annahme liber eine 
Ursache-Wirkungs-Beziehung entsprechen (siehe unten Kapitel 7). Zu beachten ist, 
dass in der aussagenlogischen Implikation an sich weder zeitliche noch ursachliche 
Angaben enthalten sind: B kann zeitlich vor A liegen oder Ursache von A sein. 

0 Nach der Psychoanalyse Freuds haben alle Neurosen im Erwachsenenalter ihre Ursachen 
in ungelosten friihkindlichen Triebkonflikten. Aus dem Auftreten einer Neurose (N) folgt 
also, dass ein Triebkonflikt (K) vorgelegen haben muss. Es gilt also N — > K, wobei N 
spater als K auftritt. Der Triebkonflikt ist nach Freud also notwendige Bedingung fiir das 
Entstehen einer Neurose im Erwachsenenalter. Er ist aber keine hinreichende Bedingung 
fiir das Auftreten einer Neurose, denn der ungeloste Konflikt kann vollstandig verdrangt 
sein oder sich in anderen Symptomen auBern. Es gilt also nicht K —> N. 



3.3 Pradikatenlogik 

Mit Hilfe der im vorangegangenen Kapitel besprochenen Aussagenlogik bestimmen 
wir den Wahrheitswert von Aussagenverkniipfungen in Abhangigkeit von den 
Wahrheitswerten der verknlipften Aussagen. Die Aussagen werden in der Aussagen- 
logik stets als Ganzes betrachtet, man kann mit der Aussagenlogik weder den Aufbau 
einer Aussage noch den Inhalt beschreiben. 



172 



Meyer, Schiitzwohl & Reisenzein (1993, S. 56-64) 
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Mit der Quantoren- oder Pradikatenlogik konnen wir eine Aussage naher 
analysieren. Jede Aussage besteht aus mindestens zwei Konstituenten: der Nominal- 

1 77 

und der Verbalphrase, kurz auch als Subjekt und Pradikat bezeichnet. 

0 Bei der Aussage „Die neue Mitarbeiterin hat sehr gute Programmierkenntnisse“ ist das 
Subjekt „Die neue Mitarbeiterin“, wahrend das Pradikat den Rest des Satzes umfasst. 

Eine elementare Aussage ordnet einem Subjekt ein Pradikat (d.h. ein Attribut, eine 
Eigenschaft, ein Merkmal) zu. Die Pradikaten- oder Quantorenlogik enthalt dement- 
sprechend zwei Arten von Symbolen, durch die diese Teile bezeichnet werden: 

• die Subj ektkonstanten und -variablen fur Dinge, Personen oder sonstige Entitaten, 

• die Pradikate fur Merkmale, Eigenschaften oder Beziehungen der Subjekte. 

Hinzu kommt eine dritte Gruppe von pradikatenlogischen Symbolen: 

• die logischen Konstanten: 

- die aus der Aussagenlogik bekannten Junktoren (Satzverkntipfungen) und 

- die sog. Quantoren, mit denen die Gtiltigkeitsbereiche von Pradikat- 
zuschreibungen ausgedriickt werden. 

Mit diesem pradikatenlogischen Instrumentarium kann nicht nur die Struktur einer 
Aussage detaillierter beschrieben werden. Es konnen auch die Beziehungen 
zwischen verschiedenen Aussagen spezifiziert werden. 

Subjektkonstanten bezeichnen bestimmte Subjekte (Personen, Dinge oder 
Entitaten). Die einfachste Form einer pradikatenlogischen Aussage ordnet einem 
bestimmten Subjekt a ein bestimmtes Pradikat P zu und wird als P(a) symbolisiert. 174 

0 In psychologischen Aussagen konnen Subjektkonstanten Namen fur ganz bestimmte 
Personen oder Gruppen sein, z.B. „Napoleon“, „die Lehrer der Gesamtschule Griinthal“, 
sie konnen aber auch Namen fur abstrakte Entitaten wie „das Selbstkonzept“ sein. 
Einfache psychologische Pradikate sind intelligent 11 , „nervos“, „differenziert“ usw. 

0 Ist a die Belegschaft eines bestimmten Betriebs und ist U das Pradikat „unzufrieden“, 
kann die Aussage „Die Belegschaft a ist unzufrieden“ durch U(a) ausgedriickt werden. Ist 
b eine andere Belegschaft, sind auch U(b) sowie U(a) a U(b) sinnvolle Aussagen. 

Stelligkeit 

Verschiedene Pradikate unterscheiden sich durch ihre Stelligkeit, d.h. durch die 
Anzahl der Subjekte, Objekte oder Entitaten, auf die sich die Zuordnung bezieht. 
Einstellige Pradikate bezeichnen Eigenschaften von Entitaten, mehrstellige Pradikate 
Beziehungen oder Relationen zwischen den Entitaten. 



Anderson (1996a, S. 346) 

174 In den Kognitionswissenschaften werden mit dieser pradikatenlogischen Schreibweise 
die Propositionen beschrieben, durch die, nicht an eine bestimmte Sprache gebunden, 
unser Wissen reprasentiert werden kann (Anderson, 1996a; Eysenck & Keane, 1995; 
Stillings et al., 1995). 
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0 Das Pradikat „ist mannlich“ ist einstellig und kann z.B. durch M(a) symbolisiert werden, 
wenn a eine bestimmte Person bezeichnet. Zweistellig ist das Pradikat „ist alter als“. 
Dreistellig ist das Pradikat „mag lieber als“. Die Aussage, „Hans mag Allgemeine 
Psychologie lieber als Entwicklungspsychologie“ kann als M(h,a,e) ausgedriickt werden. 

Pradikate unterschiedlicher Stelligkeit haben stets unterschiedliche Bedeutung. 
Wahrend in der Umgangssprache fur ein- und mehrstellige Pradikate oft gleiche 
Worter verwendet werden, sollte man sie in der Logik unterschiedlich bezeichnen. 

0 Das Pradikat U in der Beispielaussage U(b), „Die Belegschaft b ist unzufrieden“, ist 
einstellig. In der Aussage „Die Belegschaft ist unzufrieden mit dem Kantinenessen“ ist 
das Pradikat zweistellig, es beschreibt eine Relation zwischen Belegschaft und Kantinen- 
essen. Die Aussage kann z.B. als U 2 (b,k) geschrieben werden. Die Aussage „Der Inhaber 
ist mit der Meinung der Belegschaft liber das Kantinenessen unzufrieden 11 beinhaltet ein 
dreistelliges Pradikat und kann als U 3 (i,b,k) geschrieben werden. 

Variablen 

Subjektvariablen sind Platzhalter fur verschiedene mogliche Subjekte. Sie werden in 
der Pradikatenlogik meist x, y usw. genannt. Die Namen fur die konkreten Subjekte 
werden als Werte oder Auspragungen der Variablen bezeichnet. In der wissenschaft- 
lichen Umgangssprache werden Subjektvariablen und -konstanten meist nicht 
deutlich voneinander getrennt, haufig werden Subjektvariablen sogar vollig fortge- 
lassen. 

0 Die Aussage „Wenn eine Belegschaft unzufrieden ist, ist der Krankenstand hoch“ bezieht 
sich auf viele mogliche Belegschaften. Sie muss deshalb mit Subjektvariablen formuliert 
werden: U(x) — > K(x), wobei K das Pradikat „hoher Krankenstand 11 darstellt. 

0 Knappe Feststellungen wie „die Anstrengung steigt bei erhohter Schwierigkeit“ beziehen 
sich auf verschiedene mogliche Personen, Aktivitaten und Zeitpunkte. Bei naherer 
Betrachtung miissen sie folglich mit mehreren Subjektvariablen formuliert werden, z.B. 
als SE(x,y,t) — > AE(x,y,t), wobei SE fiir die Schwierigkeits- und AE fur die 
Anstrengungserhohung steht und x, y und t fiir Personen, Aktivitaten und Zeitpunkte. 

Auf Subjektvariablen bezogene Formulierungen wie U(x), U(x) — > K(x) oder 
U 3 (x,y,z) haben noch keinen bestimmten Wahrheitswert und sind deshalb im 
logischen Sinne noch keine Aussagen, sondern Aussageformen. Beim Einsetzen 
bestimmter Auspragungen der Subjektvariablen konnen sie zu wahren Aussagen 
werden, bei anderen Auspragungen jedoch zu falschen. Wird durch Einsetzen einer 
bestimmten Konstante eine Aussageform zu einer wahren Aussage, sagt man, dass 
die Dinge, die diese Konstante bezeichnet, diese Aussageform erfilllen. 



Quantoren 

Eine andere Moglichkeit, von Aussageformen zu Aussagen zu kommen, besteht 
darin, die freien Subjektvariablen zu „binden“ oder zu „quantifizieren“. In der 
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Umgangssprache erfolgt dies dadurch, dass wir allgemein angeben, welche oder wie 

viele mogliche Subjekte unsere Aussageform erflillen sollen. 

0 Fur psychologische Beziehungen wie die zwischen Arbeitszufriedenheit und Kranken- 
stand wird haufig unterstellt, dass sie fur alle betroffenen Personen gilt, d.h. z.B. fur alle 
Arbeitnehmer. Man kann aber auch vorsichtiger sein und annehmen, dass die Beziehung 
nur fur die meisten Arbeitnehmer oder gar nur fiir einige Arbeitnehmer gilt. 

In der Logik stehen fur Quantifizierungen zwei Quantoren zur Verftigung: 175 

• Der AUquantor wird durch V symbolisiert und hat die gleiche Bedeutung wie die 
umgangssprachlichen Formulierungen „fiir alle“ oder „jeder“. Entsprechende 
Aussagen werden als Allaussagen bezeichnet. 

0 Die Aussage, dass alle Betriebe mit unzufriedener Belegschaft einen hohen 
Krankenstand haben, lautet in pradikatenlogischer Formulierung Vx: U(x) — > K(x). 

• Der Existenzquantor 3 bedeutet „es gibt mindestens ein und ahnelt damit dem 
umgangssprachlichen „fiir einige“. Entsprechende Aussagen werden als 
Existenzaussagen bezeichnet. 176 

0 Die Aussage, dass es Arbeitnehmer gibt, die nicht unzufrieden sind, kann als 3y: 
— iU(y) formuliert werden, wobei festgelegt werden muss, dass die Subjektvariable y 
fiir einzelne Arbeitnehmer steht (nicht fiir ganze Belegschaften wie die Variable x). 

In einer Aussage konnen auch beide Quantoren ein- oder mehrfach vorkommen. 

0 Wollen wir ausdriicken, dass „irgendjemand immer mit dem Kantinenessen unzu- 
frieden ist“, konnen wir dies logisch als Vk 3y: U 2 (y,k) schreiben: Fiir jedes Kanti- 
nenessen gibt es mindestens einen Arbeitnehmer, der unzufrieden mit ihm ist. 



3.4 Deduktive Schltisse 

Wissenschaftliches Denken und Argumentieren soil, insbesondere im Unterschied zu 
unseren alltaglichen Uberlegungen, geordneter und rationaler sein. Dabei wird 
rationales Denken haufig mit logisch korrekten Schltissen gleichgesetzt. Nachdem 
wir die Grundziige der Aussagen- und der Pradikatenlogik kennen gelernt haben, 
wird im folgenden dargestellt, was unter logisch korrekten und zwingenden 
Schliissen zu verstehen ist (Kapitel 3.4.1 und 3.4.2). Im Kapitel 3.4.3 gehen wir auf 
die wichtige Unterscheidung zwischen logischen und empirischen Wahrheiten ein. 



175 In der hier vorgestellten Pradikatenlogik 1. Stufe werden nur Subjektvariablen durch 
Quantoren gebunden. Werden auch Pradikate als Variablen betrachtet und gebunden, 
hat man eine Pradikatenlogik hoherer Stufe (Reinhardt & Soeder, 1978, S. 18-19). 
Manche Autoren verwenden als Symbole A und V. 

177 Dies kommt beispielsweise in den Lexikondefinitionen auf Seite 17 zum Ausdruck. 
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3.4.1 Schlussformen in der Aussagenlogik 

In der Aussagenlogik werden zusammengesetzte Aussagen, die unabhangig davon, 
welche Wahrheitswerte ihre Komponenten haben, stets wahr sind, als allgemeingiil- 

178 

tige Aussageformen bezeichnet. 

Zwei grundlegende allgemeingultige Aussageformen sind 

(3-D A v — iA der Satz vom ausgeschlossenen Dritten 

(3-2) --(A a — iA) der Satz vom Widerspruch. 

Dass diese Aussageformen stets wahr sind, folgt unmittelbar aus der Grundannahme 
der Aussagenlogik, dass jede Aussage entweder wahr oder falsch ist. 

Logische Inkonsistenz 

Aus dem Satz vom Widerspruch ergibt sich, dass die Konjunktion A a — iA immer 
falsch ist. Eine wissenschaftliche Theorie, die gleichzeitig eine Aussage A und ihr 
logisches Gegenteil — iA enthalt, wird als inkonsistent bezeichnet und ist immer 
falsch. Inkonsistente Theorien sind zur wissenschaftlichen Erklarung und 
praktischen Anwendung nicht geeignet, denn aus einer inkonsistenten Theorie lasst 
sowohl jede Vorhersage wie ihr Gegenteil ableiten. 179 

Modus tollens und Modus ponens 

Allgemeingultige Aussageformen, die mindestens eine Implikation enthalten, werden 
als Allgemeingultige Schlussformen bezeichnet. Sie sind von besonderem Interesse, 
weil sie Regeln darstellen, nach denen man von wahren Aussagen zu anderen wahren 
Aussagen gelangen kann. 

Die wichtigen allgemeingiiltigen Schlussformen sind der Modus ponens und der 
Modus tollens : m 

(3-3) [(A -> B) a A] — » B der Modus ponens 

(3-4) [(A — » B) a — iB] — > — i A der Modus tollens 



178 

Haufig spricht man auch von Lehrsatzen der Aussagenlogik. 

179 Da A a — iA falsch ist, sind fur jede Aussage X sowohl (A a — iA) — > X wie (A a — iA) — > 
— iX stets wahr. Ausfiihrlicher zur Konsistenz von Theorien: Gadenne (1994a). Der 
Begriff Widerspruch wird oft nicht in der strengen logischen Bedeutung verwendet, 
sondern z.B. auch im Sinne von erwartungskontrar (Opp, 1976, S. 120). 

1 80 

Fur die Aussagenlogik bedeutsam sind auBerdem die beiden Satze von deMorgan: 

— i(A v B) <— > ( — A a - iB) und — i(A a B) <— > ( — iA v - iB). 

Bei der Formulierung aussagenlogischer Ausdriicke kann man wie in der Algebra durch 
Klammern die Reihenfolge der Operationen festlegen und die Lesbarkeit verbessern. 
Wie in der Algebra („Punktrechnung geht vor Strichrechnung“) gibt es auch eine feste 
Bindungsordnung: — i bindet starker als a, dieser starker als v, dieser starker als — >. 
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In beiden Schlussformen driickt das zweite Implikationszeichen jeweils eine 
zwingende logische Ableitung oder Folgerung aus: 

• Wenn die Implikation A — » B gilt und wenn die Aussage A wahr ist, folgt daraus 
zwingend die Wahrheit der Aussage B (Modus ponens). 

• Wenn die Implikation A — » B gilt und wenn B falsch ist, lasst sich daraus die 

101 

Falschheit von A ableiten (Modus tollens). 

Wenn wir im Alltag mit Wenn-dann-Aussagen umgehen, bereiten uns Folgerungen 
gemaB des Modus ponens keine Schwierigkeiten. Dagegen haben Personen 
(zumindest unter bestimmten Umstanden) erhebliche Schwierigkeiten mit Folgerun- 
gen, die dem Modus tollens entsprechen. Dabei wird nicht selten von der Falsch- 
heit von A auf die Falschheit von B geschlossen, was logisch nicht zwingend ist. 

0 A sei die Aussage „eine Person wird als Kind haufig allein gelassen 44 und K sei die 
Aussage „eine Person sucht als Erwachsene haufig Anschluss an andere Menschen 44 . Der 
Allsatz Vx: A(x) — > K(x) entspricht der Gesetzesannahme, dass alleingelassene Kinder 
als Erwachsene ein ausgepragtes Anschlussverhalten zeigen. Wenn diese Gesetzesaus- 
sage fur eine Person namens Petra (abgektirzt p) richtig ist, bedeutet dies: 

- Wenn Petra haufig allein gelassen worden ist, A(p), dann sucht sie nach dem der 
Modus ponens haufig Anschluss an andere Menschen, K(p). 

- Wenn Petra nicht haufig allein gelassen worden ist, d.h. wenn A(p) falsch ist, folgt 
daraus keineswegs, dass auch K(p) falsch ist, d.h. dass Petra nicht haufig den Kontakt 
zu anderen Menschen sucht. 

- Wenn K(p) falsch ist, d.h. wenn Petra keinen Kontakt sucht, folgt daraus gemaB 
Modus tollens , dass A(p) falsch ist, sie also nicht haufig allein gelassen worden ist. 183 

Logischer Beweis 

Der explizite Beweis, dass eine Aussage- oder Schlussform tatsachlich allgemein- 
gtiltig ist, erfolgt dadurch, dass man eine Wahrheitstafel aufstellt und zeigt, dass die 
zusammengesetzte Aussage ftir alle moglichen Kombinationen von Wahrheitswerten 
der Grundaussagen A und B wahr ist. 



181 Die erste Implikation in den Pramissen der beiden Schlussformen drtickt dagegen keinen 
logisch zwingenden Schluss aus, sondern einfach die Voraussetzung, dass zwischen den 
Aussagen A und B eine implikative (und nicht etwa konjunktive oder disjunktive) 
Beziehung besteht. Den Junktor — > (wie in A — > B) bezeichnet man in diesem Fall als 
materielle Implikation, wahrend man eine Implikation, die einen logischen zwingenden 
Schluss darstellt, mitunter der Deutlichkeit halber durch einem Doppelpfeil 
symbolisiert (Regenbogen & Meyer, 1998, S. 309-310). 

182 Anderson (1996a, S. 304-314), Liier & Spada (1990, S. 220-226), Beller (1999) 
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Um Missverstandnisse zu vermeiden, sei ausdrucklich betont: Diese Argumentationen 
gelten nur unter der Voraussetzung, dass die Aussage Vx: A(x) — > K(x) wahr ist. 
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0 Um den Modus tollens [(A — > B) a — iB] —> — iA zu beweisen, muss man diesen Ausdruck 
von der innersten Klammerstufe beginnend analysieren. Um dies nachzuvollziehen, 
gehen wir die Tabelle 3.3 von links nach rechts durch. 

In den ersten beiden Spalten sind alle vier moglichen Kombinationen der Wahrheits- 
werte der Aussagen A und B beschrieben, wie wir es bereits aus der Definition der 
Junktoren in Tabelle 3.2 kennen. In der dritten und vierten Spalte sind die Wahrheits- 
werte flir die negierten Aussagen aufgefuhrt, die in den weiteren Schritten noch benotigt 
werden. 

Die ftinfte Spalte enthalt die Wahrheitswerte flir die Aussage A — > B, die direkt aus 
Tabelle 3.2 ubernommen sind. Die Wahrheitswerte flir die Aussage (A — > B) a — iB in der 
sechsten Spalte ergeben sich, aus den Wahrheitswerten flir die Komponenten A — > B und 
— iB und die Definition der Wahrheitswerte fur eine Konjunktion a aus Tabelle 3.2. 
Deshalb hat die Aussage (A — > B) a — iB nur dann den Wahrheitswert W, wenn sowohl 
— iB als auch A — > B wahr sind. 

Die Wahrheitswerte in der letzten Spalte ergeben sich schlieBlich aus den eben 
ermittelten Wahrheitswerten flir (A — > B) a — iB, den Wahrheitswerten flir — A in Spalte 3 
und der Definition der Implikation aus Tabelle 3.2. Dabei ergibt sich in den ersten drei 
Zeilen ein W, weil die Pramisse (A — > B) a — B gemaB der vorletzten Spalte falsch und 
die Implikation deshalb immer wahr ist. Im Falle der letzten Zeile ist der Modus tollens 
wahr, weil sowohl die Pramisse wie die Konklusion — A wahr sind. 

Tabelle 3.3 : Wahrheitstafel zum Beweis des Modus tollens 



A 


B 


-iA 


— iB 


A — > B 


(A — > B) a -iB 


[(A — > B) a -iB] -> -iA 
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W 
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W 
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3.4.2 Syllogismen in der Pradikatenlogik 

Wie in der Aussagenlogik gibt es auch in der Pradikatenlogik Aussage- und Schluss- 
formen, die immer den Wahrheitswert W haben. Ein typisches Beispiel ist das 
folgende : 

(3-5) 3x [A(x) a B(x)] — > 3x A(x) a 3x B(x) 

Aus der Wahrheit der Aussage, dass mindestens ein Subjekt mit den Eigenschaften A 
und B existiert, folgt also stets die Wahrheit der Aussage, dass es mindestens ein 
Subjekt mit der Eigenschaft A und mindestens ein Subjekt mit der Eigenschaft B 
gibt. Die Umkehrung gilt allerdings nicht, d.h. die Implikation kann nicht zu einer 
Aquivalenz verscharft werden. 

0 Wenn es in einer Klinik mindestens eine Person gibt, die magerstichtig und schizophren 
ist, dann ist es naturlich auch zutreffend, dass es dort mindestens eine magersuchtige und 
mindestens eine schizophrene Person gibt. Umgekehrt folgt aus der Tatsache, dass es in 
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der Klinik eine magersiichtige und eine schizophrene Person gibt, jedoch nicht, dass es 
auch mindestens eine Person gibt, die sowohl magerstichtig wie schizophren ist. 

Die wichtigsten allgemeingultigen Schlussformen der Pradikatenlogik entsprechen 
den sog. Syllogismen, die im folgenden besprochen werden. 



Charakterisierung 

Syllogismen gehen auf Aristoteles zuriick und bilden den Grundstock der klassischen 
Logik. 184 Ihre Charakteristika konnen anhand eines Beispiels erlautert werden: 



(3-6) Alle Universitatsprofessoren sind promoviert. 

Einige Psychologen sind Universitatsprofessoren. 

Einige Psychologen sind promoviert 

Die ersten beiden Aussagen bilden die Pramisse des Syllogismus, die dritte Aussage 
die Konklusion. Wenn die Pramisse wahr ist, folgt daraus die Wahrheit der 
Konklusion. Der Schluss von der Pramisse auf die Konklusion wird durch eine 
waagerechte Linie ausgedruckt. Abstrakt gefasst lautet dieser Syllogismus: 



(3-7) Alle M sind P 

Einige S sind M 
Einige S sind P 

Die Konklusion der Syllogismen ist stets eine Aussage, die einem Subjekt S ein 
Pradikat P zuordnet. Die Pramisse besteht aus zwei Aussagen: einer zu S und einer 
zu P. In jeder von ihnen tritt ein dritter Begriff M auf, der Mitte l beg riff ge n an n t wird. 

Als Quantoren konnen in den Aussagen des Syllogismus „alle“ und „einige“ 
auftreten, und das Pradikat kann entweder positiv (bejahend) oder negativ 
(verneinend) sein. Dadurch ergeben sich vier mogliche Formen von Aussagen: 



• universell positiv: z.B.: 

• partikular positiv: 

• partikular negativ: 

• universell negativ: 



„Alle S sind P“ 

„Einige S sind P“ 
„Einige S sind nicht-P“ 
„Alle S sind nicht-P“ 



d.h. „Kein S ist P“. 



Pradikat en logisch e Darstellu ng 



Jede der in den Syllogismen auftretenden Aussagen konnen wir pradikatenlogisch 
ausdriicken. Dabei entsprechen universelle Aussagen Implikationen mit einem All- 
quantor, und partikulare Aussagen entsprechen Konjunktionen mit einem Existenz- 
quantor. Unser Beispiel (3-6) bzw. (3-7) wird dann zu: 



184 



zur Einfuhrung: Kunzmann, Burkard & Wiedmann (1991), Tugendhat & Wolf (1983), 
ausfiihrlicher: Kondakow (1978), Freytag-Loringhoff (1955) 
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(3-8) Vx: [M(x) P(x)] 

3x: TS(x) a M(x)1 
3x: [S(x) a P(x)] 

Diese syllogistische Figur entspricht also einem einzigen pradikatenlogischen Satz: 
(3-9) {Vx: [M(x) — ■> P(x)] a 3x: [S(x) a M(x)]} — ■> 3x: [S(x) a P(x)]. 

Falsche und korrekte Syllogismen 

Insgesamt gibt es 64 verschiedene mogliche Syllogismen. Von ihnen sind allerdings 
nur 15 korrekt. Bei den anderen folgt die dritte Aussage nicht zwangslaufig aus den 
beiden ersten. Ein Beispiel fiir einen falschen Syllogismus ist der folgende: 

(3-10) Alle P sind M bzw. Vx: [P(x) — ■> M(x)] 

Ade S sind M Vx:. .[S(xJ ^ M(x)J 

Alle S sind P Vx: [S(x) -4 P(x)] 

Die Falschheit ist relativ einfach nachzuweisen: Es genligt, ein Anwendungsbeispiel 
zu finden, bei dem die Pramissen wahr sind, die Konklusion jedoch falsch ist: 

(3-1 1) Alle Psychiater haben studiert. 

Alle .Diplom-Psycholo^en haben studiert, 

Alle Diplom-Psychologen sind Psychiater. 

Die Korrektheit eines Syllogismus nachzuweisen, ist oft schwieriger. In der 
klassischen Logik wurden 19 der 64 moglichen Syllogismen als korrekt identifiziert. 
In der modernen mathematischen Logik hingegen entsprechen nur 15 dieser 
Syllogismen Aussageformen, die allgemeingiiltig sind. 185 

Syllogismus der Subordination 

Zur Erlauterung von Syllogismen wird haufig ein bekanntes Beispiel verwendet: 

(3-12) Alle Menschen sind sterblich 

Sokrates ist ein Mensch 
Sokrates ist sterblich 

Eine Ubertragung in pradikatenlogische Formulierungen ergibt: 

(3-13) Vx: [M(x) P(x)] 

M(Sokrates) 

P(Sokrates) 

Auf den ersten Blick ist dies gar kein Syllogismus, weil die zweite Pramisse eine 
Aussage uber das konkrete Individuum „Sokrates“ ist und nicht, wie ublich, eine 
Aussage iiber Individualvariablen, die durch Quantoren gebunden sind. Wir konnen 
allerdings Individualkonstanten stets in Pradikate mit Individualvariablen 



185 



Frey tag-Loringhoff (1955, S. 102-110), Kondakow (1978, S. 168-171, 467-468) 
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umwandeln: Das Pradikat S(x) kann einfach die Identitat eines Individuums 
bezeichnen, also in unserem Beispiel „ist Sokrates“. Dass Sokrates ein Mensch ist, 
kann dann wie folgt ausgedrlickt werden: 3x: [M(x) a S(x)]. Der Schluss auf die 
Sterblichkeit des Sokrates entspricht dann einem korrekten Syllogismus: 

(3-14) Alle M sind P bzw. Vx: [M(x) — > P(x)] 

Einige M sind S 3x: TMlx) a S(x)1 

Einige S sind P 3x: [S(x) a P(x)] 

Dieser Syllogismus der Subordination liegt vielen alltaglichen Urteilen zugrunde, 
denn wir schlieBen oft von Eigenschaften, die unserer Uberzeugung nach alien 
Objekten einer Gruppe zukommen, auf Eigenschaften von einzelnen Mitgliedern. 186 

0 Die Uberzeugung „alle Alkoholiker sind willensschwach“ und die Information „Hans ist 
Alkoholiker“ ftihrt uns zu der Uberzeugung „Hans ist willensschwach“. 

Das Hauptproblem derartiger Schliisse liegt darin, dass die erste, universelle 
Pramissenaussage haufig nicht wahr ist. Statt „alle M sind P“ gilt „einige M sind 
nicht-P“. Aus der Pramisse folgt dann weder die Konklusion noch ihr Gegenteil, die 
Konklusion ist also weder zwangslaufig wahr noch zwangslaufig falsch. 

Umgang mit Syllogismen 

Zahlreiche psychologische Untersuchungen zeigen, dass Personen ohne spezielle 

logische Vorbildung bei der Beurteilung der Korrektheit syllogistischer Argumente 

haufig Fehler machen. 187 Daflir gibt es eine Reihe von Griinden. Erstens ist die 

Kapazitat zur Verarbeitung verschiedener Informationen sehr beschrankt und wird 

beim syllogistischen Denken leicht iiberschritten. Zweitens werden partikulare oder 

negative Aussagen im Syllogismus mitunter falsch interpretiert. Drittens spiegeln die 

• • 

mentalen Modelle, die Menschen sich zur Representation und Uberpriifung der dar- 
gestellten Beziehungen konstruieren, nicht alle moglichen Falle ausreichend wider. 

3.4.3 Logische und empirische Wahrheit 

Bei der Anwendung der Aussagen- und der Pradikatenlogik muss deutlich zwischen 
zwei verschiedenen Bedeutungen des Begriffs der Wahrheit unterschieden 
werden. 188 

Logische Wahrheit 

Logisch wahr sind alle Aussagen, die allgemeingultigen aussagen- und pradikaten- 
logischen Aussageformen entsprechen, z.B. der Modus ponens, der Modus tollens 

1 86 

In der Kognitionspsychologie wird dieses konzeptuelle Wissen durch semantische 
Netzwerke beschrieben (Anderson, 1996a, S. 147-149). 

Anderson (1996a, S. 314-320), Luer & Spada (1990, S. 226-235) 

Tugendhat & Wolf (1983, S. 31-49) 



187 

188 
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und die korrekten Syllogismen. Diese logische Wahrheit besteht aufgrund der Form 
der Aussage und der Definition der Junktoren und Quantoren. Sie ist unabhangig von 
den eingesetzten Pradikaten und Subjekten. 

0 Die Aussage „Wenn alle Depressiven selbstmordgefahrdet sind und alle Schizophrenen 
depressiv sind, dann sind alle Schizophrenen selbstmordgefahrdet 11 lautet in pradikaten- 
logischer Formulierung 

(3-15) { Vx: D(x) -» G(x) a Vx: S(x) -» D(x)} -» Vx: S(x) -» G(x). 

Die Aussage insgesamt ist logisch wahr, denn sie entspricht dem Modus barbara, dem 
einfachsten korrekten Syllogismus: 

(3-16) Alle M sind P 

Alle S sind M 
Alle S sind P 

Empirische Wahrheit 

Von der logischen Wahrheit zu unterscheiden ist die Wahrheit im empirischen Sinn: 

Eine Aussage ist genau dann empirisch wahr, wenn sie mit der Wirklichkeit iiber- 

einstimmt, wenn also eine Korrespondenz oder Isomorphie zwischen Aussage und 

Realitat besteht . 189 Wahrheit im nicht-logischen (oder materialen ) Sinn ist also die 
• • 

Ubereinstimmung einer Aussage mit den tatsachlichen Sachverhalten bzw. mit 
denjenigen Urteilen oder Meinungen liber diese Sachverhalte, die man gerade 
zugrunde legt. 

Zwischen empirischer und logischer Wahrheit besteht insofern eine Beziehung, 
als eine Aussage nicht empirisch falsch sein kann, wenn sie logisch wahr ist. 

0 Die Aussage „Wenn alle Depressiven selbstmordgefahrdet sind und alle Schizophrenen 
depressiv sind, dann sind alle Schizophrenen selbstmordgefahrdet 44 ist logisch wahr und 
kann deshalb nicht empirisch falsch sein. 

Dementsprechend kann eine logisch falsche Aussage nicht empirisch wahr sein. 

0 Die Aussage „Alle Depressiven sind selbstmordgefahrdet und nicht selbstmordgefahrdet 44 
ist logisch falsch, denn sie verstoBt gegen den Satz vom Widerspruch (3-2). 



Regenbogen & Meyer (1998, S. 716), Strube et al. (1996, S. 774-776), MittelstraB 
(1996, S. 582-586). 

Neben dieser bereits von Kant vertretenen Korrespondenztheorie der Wahrheit 
werden auch Koharenztheorien vertreten, nach denen die Wahrheit einer Aussage von 
ihrer Vertraglichkeit mit anderen als wahr akzeptierten Aussagen abhangt. 

Als Kriterien fur die Wahrheit einer Aussage werden auBerdem die unmittelbare 
Evidenz , die praktische Nlitzlichkeit und vor allem der Konsens der Fachleute 
hervorgehoben. Die Konsenstheorie der Wahrheit wird unter anderem von Jurgen 
Habermas (1975) und der konstruktivistischen Erlanger Schule (Toebe et al., 1977) 
vertreten. Sie entspricht einem Kulturrelativismus , wonach die Wahrheit einer Aussage 
nichts anderes ist als ihre Akzeptanz in einer Gruppe (Hartmann, 1998, S. 4). 
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Die Frage der empirischen Wahrheit stellt sich demnach nur fur Aussagen, die nicht 
eindeutig logisch wahr oder logisch falsch sind: Ob eine derartige Aussage empirisch 
wahr oder falsch sind, muss auBerhalb der Logik durch Beobachtungen und Beurtei- 
lungen festgestellt werden. Unterschiedliche Kriterien, Methoden, Informationen, 
Kenntnisse, Einstellungen usw. konnen dabei zu divergierenden Ergebnissen fiihren. 

0 Ob die Aussage „alle Depressiven sind selbstmordgefahrdef ‘ empirisch wahr oder falsch 
ist, kann ein Psychiater aufgrund der klinischen Erfahrung beantworten. Die Antwort 
hangt unter anderem davon ab, wie er die Gruppe der Depressiven abgrenzt und wann er 
von einer Selbstmordgefahrdung spricht. 190 Wir konnen aber auch eine wissenschaftliche 
Untersuchung durchftihren, in der wir bei einer moglichst groGen und reprasentativen 
Gruppe von Depressiven nach Anzeichen fur eine Selbstmordgefahrdung suchen. Auch 
hier hangt das Ergebnis unter anderem von der Zusammensetzung der Unter- 
suchungsgruppe, den betrachteten Indikatoren und den verwendeten Kriterien ab. 

Da die Wahrheit der interessierenden wissenschaftlichen Aussagen weder eindeutig 
zu definieren noch eindeutig festzustellen ist, wird der Begriff der Wahrheit im 
alltaglichen Wissenschaftsbetrieb haufig vermieden. Stattdessen sagen wir beispiels- 
weise vorsichtiger, dass eine Hypothese oder Theorie „zutreffend“ oder „gtiltig“ zu 
sein scheint oder dass wir sie „akzeptieren“. 

Logische und empirische Notwendigkeit 

Die Unterscheidung zwischen logischer und empirischer Wahrheit fiihrt zu zwei 
unterschiedlichen Interpretationen der Implikation: zur Unterscheidung zwischen 
logischen und empirischen Notwendigkeiten. 

Bei einem korrekten Syllogismus oder einem anderen allgemeingiiltigen 
logischen Schluss (z.B. Modus tollens) erfolgt der Schluss von der Pramisse auf die 
Konklusion mit logischer Notwendigkeit. Diese logisch zwingende Folgerung wird 
in der iiblichen zeilenweisen Darstellung eines Syllogismus, wie z.B. in (3-8), durch 
die Linie zwischen Pramisse und Konklusion ausgedriickt, in der 
pradikatenlogischen Notation, z.B. in (3-9), durch das Implikationszeichen hinter der 
Pramisse. 

In den universellen Aussagen, die unter anderem als Bestandteile der Syllogismen 
auftreten, ist die Implikation eine materielle: Sie bezeichnet keine logische Not- 
wendigkeit, sondern eine (angenommene) empirische Notwendigkeit. 191 Sie repra- 
sentiert eine Aussage liber einen Zusammenhang zwischen zwei Pradikaten, die 
durch empirische Befunde bestatigt, aber auch erschiittert werden kann. Es ist also 
durchaus denkbar, dass eine angenommene empirische Notwendigkeit tatsachlich 



190 Vermutlich wird er diese Aussage als zutreffend bezeichnen, denn Suizidvorstellungen 
und -versuche kommen bei Depressiven so haufig vor, dass sie mit zu den Diagnose- 
kriterien fur die sog. Major Depression gehoren (DSM-IV, 1996, S. 382). 

191 zur Unterscheidung siehe auch oben FuBnote 181, Seite 80 
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nicht besteht. Dagegen ist keine Situation vorstellbar, in der eine logische Notwen- 
digkeit nicht gilt. 

Implikationen im Sinne von logischen und empirischen Notwendigkeiten treten in 
wissenschaftlichen Aussagen mitunter gemeinsam auf. 

0 Im Ausdruck (3-15) zur Aussage liber die Selbstmordgefahrdung bezeichnet die 
Implikation hinter der geschweiften Klammer eine logische Notwendigkeit, das heiBt sie 
gilt allein auf grand der Form der Pramissen. In den Teil- Aussagen Vx: [D(x) — > G(x)] 
und Vx: [S(x) — > D(x)] („alle Depressiven sind selbstmordgefahrdet“ und „alle Schizo- 

phrenen sind depressiv“) entsprechen die Implikationen keinen logischen, sondern an- 

192 

genommenen empirischen Notwendigkeiten, die sich als falsch herausstellen konnen. 

Deduktiv-logische Argumente in der Wissenschaft 

Wie wir in spateren Kapiteln noch sehen werden, spielen deduktiv-logische 
Schllisse in der Wissenschaftsphilosophie und der psychologischen 
Forschungsmethodik eine sehr wichtige Rolle. Auf drei Themengebiete sei explizit 
hingewiesen. 

• Seit Rudolf Carnap vertreten viele Wissenschaftsphilosphen und Fachwissen- 
schaftler die Auffassung, dass die Theorien der empirischen Wissenschaften 
genau wie die Theorien der Mathematik als deduktive Systeme aufgebaut werden 
sollen: Aus einer begrenzten Menge von Grundannahmen (Axiomen) sollen alle 
anderen Aussagen der Theorie ( Theoreme ) logisch ableitbar sein. Dieser Aufbau 
wird als Standardtheorienkonzeption bezeichnet (siehe Kapitel 11.1). 

• Seit Karl Popper vertreten viele Wissenschaftsphilosophen und Fachwissen- 
schaftler die Auffassung, dass wissenschaftliche Theorien dadurch empirisch 
gepriift werden, dass aus ihnen empirische Vorhersagen logisch abgeleitet 
werden. Treten diese Vorhersagen nicht ein, kann die Theorie nach dem Modus 
tollens falsifiziert oder angezweifelt werden. Dieses Vorgehen wird als 
Falsifikationsmethodologie bezeichnet (siehe Kapitel 9.2). 

• Seit Carl Hempel und Paul Oppenheim versteht man unter einer wissenschaft- 
lichen Erklarung eine logische Ableitung des zu erklarenden Befundes aus einer 
allgemeinen Theorie und speziellen Voraussetzungen. Diese Explikation wird als 
deduktiv-nomologische Erklarung bezeichnet (siehe Kapitel 8.1). 

In alien drei Fallen wird sich bei genauer Betrachtung herausstellen, dass die 
Argumente nur in erster Annaherung deduktiv-logischer Art sind: Theorien sind 
keineswegs deduktiv-logisch aufgebaut, sie werden auch nicht aus logisch zwin- 
genden Griinden falsifiziert, und eine wissenschaftliche Erklarung muss nicht unbe- 



192 Tatsachlich gibt es viele Personen, die schizophren, aber nicht depressiv sind, d.h. fur 
die S(x) empirisch wahr und D(x) empirisch falsch ist. Die Implikation S(x) — > D(x) ist 
fiir diese Personen dann falsch. Damit ist auch die universelle Aussage Vx: [S(x) — > 
D(x)] empirisch falsch. 
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dingt eine logische Ableitung beinhalten. Im folgenden Kapitel 4 werden wir sehen, 
dass in der Wissenschaft neben den deduktiv-logischen Schlussen auch induktive 
Argumente eine wesentliche Rolle spielen. 





4 Induktive Argumente 



Die Frage der Rechtfertigung induktiver Schliisse ist eines der altesten und 
wichtigsten Probleme der Erkenntnis- und Wissenschaftstheorie. 193 Wir werden die 
Abgrenzung von Deduktion und Induktion beschreiben (Kapitel 4.1), unter- 
schiedliche Arten von Induktion betrachten (Kapitel 4.2) und auf verschiedene 
Rechtfertigungen fur induktive Argumente eingehen (Kapitel 4.3). 



4.1 Abgrenzung von Deduktion und Induktion 

• Die logische Implikation ist eine Verbindung zwischen Aussagen, die 
wahrheitskonservierend und nicht gehaltserweiternd ist: 

- Aus der Wahrheit des ersten Satzes (der Pramisse) folgt zwangslaufig die 
Wahrheit des zweiten Satzes (der Konklusion): Wenn die Pramisse wahr ist, 
muss auch die Konklusion wahr sein. 

- Der Gehalt der Konklusion kann nicht iiber den Gehalt der Pramisse 
hinausgehen, d.h. die Konklusion kann nicht mehr aussagen als die Pramisse: 
Wenn der Gehalt des zweiten Satzes groBer ware als der des ersten Satzes, 
konnte man aus der Wahrheit des ersten nicht mit Sicherheit auf die Wahrheit 
des zweiten schlieBen. 

0 In einer Vorlesung mit 99 Teilnehmern sitzen in der ersten Reihe fiinf Personen, die wir 
mit a i bis as bezeichnen. Sie bilden eine Menge, die wir P nennen. 

Fur die Person ai haben wir feststellt, dass sie ihren Misserfolg (M) bei der Losung 
einer Statistikaufgabe nicht auf eine interne Ursache (wie z.B. ihre mangelnden 
Kenntnisse) zuriickfiihrt, sondern auf einen externen Faktor (wie z.B. die zu hohe 
Schwierigkeit der Aufgabe) attribuiert (E). Diese Feststellung konnen wir aussagen- 
logisch durch einen Satz II ausdriicken: „M(ai) a E(aj)“. Stellen wir entsprechende 
externale Attribuierungen nach Misserfolg auch fur die anderen vier Personen der ersten 
Reihe fest, erhalten wir entsprechende Aussagen 12 bis 15. 



193 



umfassendere Darstellung mit weiteren Literaturangaben: Westermann & Gerjets 
(1994), kurzer Uberblick: Westermann & Gerjets (1991) 
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Insgesamt konnen unsere Feststellungen durch eine Konjunktion dieser Aussagen 
ausgedriickt werden: II a 12 a 13 a 14 a 15. Diese Aussage ist definitionsgemaB 
Equivalent mit einem quantorenlogischen Allsatz, den wir A5 nennen: Vaj e P: M(a,) a 
Eta,). 

Es ist offensichtlich (und auch liber eine Aufstellung entsprechender Wahrheitstafeln 
beweisbar), dass zwischen A5 und zum Beispiel II eine Implikationsbeziehung besteht: 
A5 — > II. Aus der Wahrheit des Allsatzes A5 folgt deduktiv-logisch die Wahrheit des 
Individualsatzes II, weil der Gehalt von II im Gehalt von A5 enthalten ist. 

Gehaltserweiternde Schlusse 

• Das wesentliche Merkmal induktiver Argumente besteht darin, dass sie ampliativ 
sind: Der Gehalt der Konklusion geht liber den Gehalt der Pramisse hinaus. 

Aus der Wahrheit der Pramisse folgt deshalb nicht zwangslaufig die Wahrheit der 
Konklusion: Gehaltserweiternde Schlusse sind nicht wahrheitskonservierend. 

0 Neben unserem Allsatz A5 liber die fiinf Personen in der ersten Reihe haben wir einen 
Individualsatz 199: „M(a 99 ) a E(a 99 )“, der sich auf die einzige Person in der hintersten 
Reihe bezieht. Zwischen A5 und 199 besteht natiirlich keine deduktiv-logische 
Implikationsbeziehung. Vielmehr geht der Gehalt von 199 liber den Gehalt von A5 
hinaus. Deshalb kann 199 falsch sein, auch wenn A5 wahr ist. Die Wahrheit von 199 folgt 
nicht zwangslaufig aus der Wahrheit des Allsatzes A5. 

Es ist allerdings nicht sinnvoll, alle gehaltserweiternden Argumente als induktive 
Argumente zu bezeichnen. Vielmehr sprechen wir von Induktion nur dann, wenn die 
Annahme der Wahrheit der Konklusion tatsachlich auch sachlich durch die in der 
Pramisse zusammengefassten bisherigen Erfahrungen gestiitzt wird. Damit konnen 
induktive Schlusse pragmatisch folgendermaBen gekennzeichnet werden: 

• Wir bezeichnen ein Argument als induktiv, wenn 

1. die Wahrheit der Konklusion nicht notwendigerweise aus der Wahrheit der 
Pramisse folgt, weil der Konklusionsgehalt liber den Pramissengehalt 
hinausgeht, wenn aber 

2. die Pramisse dennoch die Konklusion in irgendeiner Weise unterstiitzt, ihr 
Gewicht verleiht oder sie wahrscheinlicher macht. 194 

0 Der „Schluss“ von der Wahrheit der Aussage „M(ai) a E(ai)“ liber die externale 
Misserfolgsattribution einer Person auf die Wahrheit einer Aussage liber die heutige 
Sonnenscheindauer auf der Zugspitze ist keine Induktion, weil die Wahrheit der beiden 
Aussagen in keinem erkennbaren Zusammenhang steht. 

Im Unterschied zur Deduktion ist ein induktives Argument kein sicherer Schluss von 
einer Pramisse auf eine Konklusion. Um die sprachlichen Formulierungen einfach zu 



194 



Dieses Kriterium kann bei Bedarf weiter prazisiert werden, indem wir z.B. fordern, dass 
sich Pramisse und Konklusion auf die gleichen Begriffe beziehen miissen. 
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halten, wird aber auch im Zusammenhang mit der Induktion von Schliissen, 
Pramissen und Konklusion gesprochen, obwohl diese Begriffe streng genommen fest 
mit deduktiv-logischen Implikationen verbunden sind. Um den Unterschied 
zumindest in den formalen Darstellungen deutlich zu machen, werden in diesem 
Kapitel induktive Argumente z.B. als A =s>B bezeichnet, wahrend die Notation A — > 
B der deduktiv-logischen Implikation vorbehalten bleibt. 



4.2 Arten der Induktion 

Obwohl die Klasse der induktiven Argumente sehr vielfaltig ist, wird der Begriff der 
Induktion haufig mit den enummerativen Induktionen (Kapitel 4.2.1) gleichgesetzt. 
Daneben treten induktive Argumente auch in Form von eliminativen Induktionen 
(Kapitel 4.2.2) und empirischen Vermutungen (Kapitel 4.2.3) auf. 

4.2.1 Enummerative Induktion 

Bei einer enummerativen Induktion wird aus einer bestimmten Anzahl beobachteter 
Falle auf nicht-beobachtete Falle geschlossen. Wird auf einzelne Situationen oder 
Personen geschlossen, liegt eine Extrapolation vor. Wird auf alle interessierenden 
Situationen oder Personen geschlossen, spricht man von einer Generalisierung. 

Beim einfachsten Fall einer Extrapolation wird aus der Tatsache, dass die Objekte 
ai bis a n das Merkmal oder die Eigenschaft F haben, die Aussage abgeleitet, dass 
auch ein wei teres Objekt a n+i die Eigenschaft F hat: 

(4-1) F(aO a F(a 2 ) a ... a F(a n ) =» F(a n+1 ). 

Die den Objekten zugeschriebene Eigenschaft F kann natiirlich auch aus einer 
Konjunktion von mehreren Eigenschaften bestehen. 

0 Im Beispiel des vorigen Kapitels 4.1 wurde vom beobachteten Zusammentreffen der 
Merkmale M (Misserfolg) und E (externale Attribution) bei den ersten fiinf Personen auf 
die letzte Person geschlossen: 

(4-2) [M(ai)AE(ai)] a [M(a 2 )AE(a 2 )j a ... a [M(a 5 )AE(a 5 )j =s> MlaggjAElagg). 

Im einfachsten Fall einer Generalisierung wird aus der Pramisse die Aussage 
abgeleitet, dass alle entsprechenden Objekte diese Eigenschaft haben: 

(4-3) F( ai ) a ... a F(a n ) => V i F(a i ) 

Eine Generalisierung kann auch in dem Schluss bestehen, dass fur alle Objekte eine 
implikative Beziehung zwischen zwei Merkmalen besteht. 

0 Das gemeinsame Auftreten von Misserfolg (M) und externaler Attribution (E) bei fiinf 
Personen konnte auf eine implikative Beziehung zwischen Misserfolg und externaler 
Attribution bei alien Personen verallgemeinert werden: 
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(4—4) [M(ai)AE(aO] a ... a [M(a 5 )AE(a 5 )] »> V, M(ai) -> E(ai). 

Diese enummerativen Induktionen beruhen auf der (impliziten) Annahme, dass die 
betrachteten Phanomene und Objekte einheitlich oder uniform sind. Je weniger diese 
Uniformitatsannahme zutrifft, desto eher fiihrt das induktive Argument zu einer 
Konklusion, die sich als empirisch falsch herausstellen wird. 

Inwieweit die Uniformitatsannahme erfullt ist, hangt vom betrachteten Merkmals- 
bereich ab. In aller Regel verhalten sich physikalische Objekte und chemische 
Substanzen viel uniformer als psychologische Untersuchungspersonen. Innerhalb der 
Psychologic wiederum ist die Uniformitat zum Beispiel bei psycho-physischen 
Merkmalen und Zusammenhangen meist erheblich groBer als bei der Betrachtung 
von Handlungsplanungen oder Krankheitsbewaltigungen. 

4.2.2 Eliminative Induktion 

Bereits die englischen Empiristen Francis Bacon und John Stuart Mill haben betont, 
dass Induktion keineswegs nur einfach enummerativ ist. Wissenschaftliche Induktion 
sollte ihrer Auffassung nach vielmehr vor allem eine eliminative Induktion sein: Alle 
anderen Einflussfaktoren sollten ausgeschlossen werden. 

• • 

Mill nennt zwei Grundmethoden der eliminativen Induktion: die Ubereinstim- 
mungsmethode und die Differenzmethode. Danach konnen wir einen allgemeinen 
implikativen oder kausalen (d.h. Ursache-Wirkungs-) Zusammenhang zwischen zwei 
Merkmalen F und G annehmen, wenn folgende Bedingungen erfullt sind: 

• F und G treten regelmaBig miteinander auf, unabhangig von der V ariation anderer 
moglicher Einflussfaktoren ( Ubereinstimmungsmethode ) und 

• Situationen, in denen G bzw. nicht-G eintritt, unterscheiden sich nur dadurch, 
dass im ersten Fall auch F vorliegt, im zweiten Fall aber nicht ( Differenzmethode ). 

Die Berechtigung eines induktiven Arguments, das heiBt das AusmaB, in dem eine 
allgemeine kausale Aussage durch Beobachtungen gestlitzt ist, hangt also nicht so 
sehr von der Anzahl der bestatigenden Instanzen und der Uniformitat des betrach- 
teten Phanomenbereiches ab. Viel bedeutsamer sind die Vielfalt an Umstanden, unter 
denen die vorliegenden Falle beobachtet worden sind. Diese Vielfalt muss oft aktiv 
gesucht oder hergestellt werden. Mills Methoden der eliminativen Induktion sind 
deshalb Anleitungen zur Durchfiihrung gezielter Untersuchungen und Experimente. 

Ein valides Experiment zur Untersuchung des Zusammenhangs von zwei 
Merkmalen F und G zeichnet sich dadurch aus, dass es zwei Beobachtungs- 
bedingungen gibt, die sich nur dadurch unterscheiden, dass in der einen F vorliegt, in 
der anderen aber nicht. Tritt nun G in der Bedingung F stets auf, in der Bedingung 
— iF aber nie, ist F eindeutig die Ursache von G (siehe dazu im einzelnen Kapitel 
7.2.5). 
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4.2.3 Empirische Vermutungen 

Zu einer wissenschaftlichen Theorie sind in der Regel verschiedene wissen- 
schaftliche Untersuchungen und Experimente durchgefiihrt worden, in denen sich die 
Gliltigkeit dieser Theorie empirisch gezeigt hat. Meist gibt es aber auch 
Untersuchungen, die zu theoriekontraren Ergebnissen gefiihrt haben. 

0 Skinners Theorie des operanten Verhaltens ist erfolgreich in vielen Experimenten 
angewendet worden, in denen unter bestimmten Reizbedingungen auf eine 
Verhaltensweise regelmaBig eine bestimmte positive Konsequenz folgte. Weit weniger 
geeignet ist die Theorie dagegen fiir die Anwendung auf Beobachtungslernen, intrinsisch 
motiviertes Verhalten und Spracherwerb. 195 

Theorien haben demnach keinen universellen, sondern nur einen beschrankten 
erfolgreichen Anwendungsbereich . 196 Haufig wird eine Theorie auf eine Situation 
angewendet, ohne dass explizit gepriift werden kann, ob sie in diesem Fall gtiltig ist. 
Man unterstellt vielmehr die Giiltigkeit der Theorie, um eine bestimmte 
Vorgehensweise zu begriinden, eine praktische Vorhersage zu machen oder eine 
erfolgversprechende MaBnahme abzuleiten. Wir bezeichnen die ungepriifte 
Annahme der Giiltigkeit einer Theorie in einer bestimmten Situation als eine 
empirische Vermutung. 

9 Bei der Untersuchung von Determinanten und Korrelaten der Zufriedenheit von 
Studierenden mit ihren Studienbedingungen griffen wir auf die Einstellungstheorie von 
Fishbein und Ajzen zuriick, um Verfahren zur Messung der Zufriedenheit zu konzipieren 
und zu grtinden. Diese Theorie konnte im Rahmen unserer Untersuchung nicht 
empirisch gepriift werden, aufgrund zahlreicher erfolgreicher Anwendungen in ahnlichen 
Kontexten wurde aber angenommen, dass sie gtiltig ist. 

Empirische Vermutungen entstehen auch, wenn keine Theorie, sondern eine 
Methode, Technik oder Vorgehensweise als erfolgreich angenommen wird. 

0 Nach der Theorie von Aaron Beck kommen Depressionen durch verschiedene Arten von 
Denkfehlern (z.B. negative Schemata, falsche Schliisse) zustande. 198 Einige Unter- 
suchungen mit entsprechenden Befragungen von Depressiven bestatigen diese Theorie. 
Wird ein Depressiver mit einer entsprechenden kognitiven Verhaltenstherapie behandelt, 
wird implizit angenommen, dass die Theorie auch fiir diese Person gilt, ohne dass eine 
wissenschaftlich strenge Uberpriifung dieser Annahme moglich oder beabsichtigt ist. 



195 

196 

197 

198 



Bower & Hilgard (1983, S. 290-303) 

Diese Sichtweise widerspricht den Auffassungen von bedeutenden Philosophen, ist aber 
durch die strukturalistische Konzeption gut begrtindet (siehe Kapitel 11.8). 

Fishbein & Ajzen (1975), Westermann, Heise, Spies & Trautwein (1996) 

Davison & Neale (1996, S. 258-260, 274) 
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4.3 Berechtigung induktiver Argumente 

Wie in diesem Kapitel deutlich geworden ist, bezeichnen wir einen „Schluss“ von 
einer Aussage auf eine andere Aussage als induktiv, wenn er gehaltserweiternd ist, 
wenn er deshalb nicht wahrheitskonservierend ist und wenn trotzdem die Konklusion 
durch die Pramisse gestiitzt wird. 

Den Ergebnissen induktiver Argumente kommt zwar nicht die absolute Sicherheit 
deduktiver Ableitungen zu, trotzdem erscheinen sie uns aber nicht ganzlich 
unbegrtindet und willkiirlich. Jedes induktive Argument A =s> B wirft damit zwei 
Fragen auf: 

• Wie begrlindet oder gerechtfertigt ist es, aus der Aussage A iiber eine begrenzte 
Anzahl von Fallen die darliber hinausgehende Aussage B abzuleiten? 

• Inwieweit wird die weiter gehende Aussage B durch die zugrunde liegende 
Beobachtungsaussage A „bestatigt“ oder „gestiitzt“? 

Diese Fragen nach der Rechtfertigung induktiver Verallgemeinerungen und nach 
dem Grad der Bestatigung von induktiv gewonnenen Vorhersagen, Hypothesen oder 
Theorien durch die zugrunde gelegten empirischen Daten umreiBen das sog. 
Induktionsproblem. Fur uns von Interesse sind zwei Wege zur Beantwortung dieses 
Problems: die analytische und die pragmatische Rechtfertigung. 

4.3.1 Analytische Rechtfertigung der Induktion 

Bei induktiven Argumenten folgt die Konklusion zwar nicht mit logischer Sicherheit 
aus der Pramisse, es scheint aber, dass die Pramisse A die Konklusion B irgendwie 
„wahrscheinlich“ macht. Ein induktives Argument A ~> B kann deshalb mit einer 
Aussage iiber eine bedingte Wahrscheinlichkeit gleichgesetzt werden. Wenn A 
gegeben ist, soil die Wahrscheinlichkeit von B hoch sein, d.h. sie soil viel groBer als 
Null sein (idealerweise sogar nahe 1 liegen). 

(4-5) A => B P(B I A) » 0 

Interpretiert wird P dabei nicht als objektive, sondern als subjektive oder personelle 
Wahrscheinlichkeit, die den Grad des Glaubens einer vollstandig rationalen Person 
an die Wahrheit der Aussage B oder an das Eintreten des von B beschriebenen 
Ereignisses ausdruckt. Falls A eine Aussage iiber eine Reihe von empirischen 
Beobachtungen ist und B eine allgemeinere Hypothese oder Theorie darstellt, kann 



199 Empirisch erfasst werden subjektive Wahrscheinlichkeiten durch direkte Einschat- 
zungen oder dadurch, dass man untersucht, mit welchem Einsatz auf das Eintreten von 
B gewettet wird. Rational sind die subjektiven Wahrscheinlichkeiten nur dann, wenn sie 
nicht notwendigerweise zu Verlusten fiihren. Dazu miissen sie u.a. die Axiome der 
statistischen Wahrscheinlichkeit erfullen (Kutschera, 1972a, S. 70-88). 
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die personelle Wahrscheinlichkeit P auch als erste Annaherung an den Grad der 
Bestatigung von B durch A interpretiert werden . 200 

Von den subjektiven Wahrscheinlichkeiten ausgehend haben Vertreter der 
Analytischen Wissenschaftsphilosophie genaue induktive Wahrscheinlichkeiten zu 
bestimmen versucht . 201 Die Grundidee besteht darin, durch Einfuhrung zusatzlicher 
Rationalitatsbedingungen die verschiedenen moglichen subjektiven Wahrschein- 
lichkeitszuordnungen eindeutig auf eine bestimmte ausgezeichnete logische 
Wahrscheinlichkeit c zu reduzieren. Sie wird als partielle logische Implikation und 
damit als eine rein analytische oder syntaktische Relation zwischen der Pramisse A 
und der Konklusion B interpretiert. So wie im deduktiven Schluss die Pramissen die 
Konklusion implizieren, weil die Konklusion im Gehalt der Pramissen enthalten ist, 
so sollen im induktiven Argument die Pramissen die Konklusion partiell implizieren, 
weil sich der Gehalt der Pramissen und der Konklusion teilweise iiberschneiden. 

Dieses Vorhaben hat sich als sehr kompliziert, schwierig und problematisch 
erwiesen. Ein primares Problem besteht darin, dass sich induktive Wahrschein- 
lichkeiten bisher nur fur kiinstliche Sprachen bestimmen lassen, die im Vergleich zur 
tatsachlichen Wissenschaftssprache sehr einfach sind. AuBerdem ergeben sich fur 
Allsatze mit unbegrenzten Objektmengen Wahrscheinlichkeitswerte von Null. Damit 
waren alle Gesetze und Elypothesen, die Aussagen von dieser allgemeinen Form 
sind, gleich unwahrscheinlich und unbestatigt. Man betrachtet logische Wahrschein- 
lichkeiten deshalb nicht mehr fur Generalisierungen, sondern nur noch fur Extra- 
polationen, deren Konklusionen Aussagen iiber einzelne Falle sind. 

4.3.2 Pragmatische Rechtfertigungen der Induktion 

Das im vorangegangen Kapitel besprochene Programm einer formalen induktiven 
Logik sollte globale, logisch-syntaktische und kontextunabhangige Regeln fur 
korrekte Induktionen erbringen. Als pragmatisch werden dagegen die philoso- 
phischen Ansatze zur Behandlung des Induktionsproblems bezeichnet, nach denen 
die Adaquatheit eines induktiven Schlusses wesentlich vom Inhalt der Pramissen und 
Konklusionen, vom Verwendungszusammenhang und von der Niitzlichkeit des 
Schlusses abhangt. Aus pragmatischer Sicht lasst sich einem induktiven Argument 
zwar „kein Garantieschein fur sicheren Erfolg beifiigen“, es lassen sich aber offenbar 
auch keine besseren Methoden finden. Deshalb kann die begriindete Ableitung 
von Erwartungen aufgrund induktiver Argumente rational sein, auch wenn sie zu 
falschen Konklusionen ftihrt. 

0 Man beobachtet zahlreiche Verhaltenstherapien von Phobien, die erfolgreich waren. 

Daraus leitet man ab, dass auch die nachsten Phobiker durch Verhaltenstherapie 



zum Grad der (induktiven) Bestatigung: Lenzen (1974), Gemes (1998), Christensen 
(1999) 

Carnap (1971, 1986), Cohen (1981), Kutschera (1972a), Stegmuller (1973a) 
Reichenbach (1935, S. 418), Salmon (1979), Strawson (1952), Holland et al. (1986) 
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erfolgreich behandelt werden konnen. Selbst wenn die nachste verhaltenstherapeutische 
Phobienbehandlung nicht erfolgreich sein sollte, war es doch rational, unter den 
gegebenen Umstanden einen Erfolg erwartet zu haben. 

Konkret wird die Berechtigung eines induktiven Arguments nicht nur von dem in der 
Pramisse zusammengefassten Wissen bestimmt, sondern auch von der vorliegenden 
Situation, der untersuchten Fragestellung, dem aktivierten Hintergrundwissen, den 
aktuellen Zielen, dem erwarteten Wissenszuwachs, dem moglichem Nutzen usf. 

Wenn wir uns vor einem bestimmten Wissenshintergrund verschiedene induktive 
Schliisse vorstellen, so konnen diese uns offensichtlich mehr oder minder begriindet 
oder gewagt erscheinen. Wir wollen im folgenden von diesem Vorverstandnis 
ausgehen und versuchen, Faktoren zu explizieren, von denen die Gtite, Adaquatheit 
oder die Berechtigung eines induktiven Schlusses abhangen kann. 

9 Von den ersten zehn untersuchten Vorlesungsteilnehmern haben acht Personen einen 
Misserfolg external attribuiert und zwei internal. Daraus ist der induktive Schluss, dass 
der Teilnehmer Nummer 99 external attribuiert, berechtigter als der ebenfalls mogliche 
induktive Schluss, dass er internal attribuiert. 

Allgemein soil die Berechtigung eines induktiven Schlusses umso hoher sein, je 

bessere Griinde es fur die Erwartung gibt, dass die Konklusion wahr ist oder sich bei 

einer Uberpriifung als wahr herausstellen wird. Eine Analyse der philosophischen 

und psychologischen Konzeptionen zum induktiven Denken fiihrt zu vier Faktoren, 

die diese Berechtigung beeinflussen: die Anzahl, die Validitat und die Variabilitat 

• • 

der bisherigen positiven Falle sowie die Ahnlichkeit der bisherigen positiven Falle 
zu dem neuen Fall. 203 

Anzahl und Anteil der bisherigen Falle 

• Die Berechtigung eines induktiven Schlusses ist umso groBer, 

- je groBer die Anzahl und der Anteil der bisherigen positiven Falle ist, die in die 
Pramisse eingehen und 

- je kleiner die Anzahl und der Anteil der bisherigen negativen Falle ist. 204 

0 Beim oben betrachteten induktiven Schluss A5 ~> 199 bezog sich die Pramisse auf die 
externalen Misserfolgsattributionen der funf zuerst untersuchten Vorlesungsteilnehmer. 
Wenn nicht nur die ersten funf der 99 Vorlesungsteilnehmer, sondern die ersten 20, 50 
oder gar 98 Teilnehmer external attribuieren, haben wir zunehmend Grund anzunehmen, 
dass 199 tatsachlich wahr ist, dass also der Zusammenhang zwischen Misserfolg und 
externaler Attribution auch fur den 99. Vorlesungsteilnehmer gilt. Die induktiven 
Schliisse der entsprechenden Allsatze A5, A20, A50 oder A98 auf die Konklusion 199 
werden dementsprechend sukzessiv immer berechtigter. 



Westermann & Gerjets (1994, S. 459-465) 

204 Die Anzahl bisheriger Beobachtungen wurde von Carnap (siehe Kapitel 4.3.1) als 
wichtigste Determinante der GroBe der induktiven Wahrscheinlichkeit herausgestellt. 
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Treten unter den bisherigen Beobachtungen auch abweichende Falle auf, so ist fur 
die Berechtigung des induktiven Schlusses nicht nur die Anzahl der beobachteten 
Sachverhalte wichtig, sondern auch der Anteil positiver Falle an der Gesamtzahl der 
Beobachtungen. 

0 Attribuieren von den ersten 50 Vorlesungsteilnehmer 40 external (d.h. 80%), fiinf aber 
internal, so ist die Berechtigung des induktiven Schlusses auf den 99. Vorlesungsteil- 
nehmer geringer als wenn alle 50 bisher beobachteten Teilnehmer external attribuieren. 
Die Berechtigung des induktiven Schlusses ist bei einem Anteil positiver Falle von 80% 
hoher als beispielsweise bei einem Anteil von 60%. 

Validitdt der Falle 

• Die Berechtigung eines induktiven Schlusses ist umso hoher, 

- je groBer die Validity, Gtite oder Sicherheit der in der Pramisse zusammen- 
gefassten positiven Befunde ist und 

- je kleiner die Validitat, Gtite oder Sicherheit der negativen Befunde ist. 

Die Validitat empirischer Befunde kann durch eine Fiille von Faktoren herabgesetzt 
werden (siehe Kapitel 13). Am schwersten wiegen Fehler bei der Erfassung der 
beteiligten Variablen (Variablenvaliditat), systematische Unterschiede zwischen den 
Untersuchungsbedingungen (interne Validitat) und falsche Datenauswertungen und 
Ergebnisinterpretationen (statistische Validitat). 

0 Die Giite der empirischen Beobachtungen, die die Pramisse A5 des induktiven Schlusses 
A5 => 199 bilden, ist z.B. herabgesetzt, falls die Personen gar keinen Misserfolg erlebt 
haben oder falls sie ihre Antworten verfalschen, um einen guten Eindruck zu machen. 

Variabilitdt der Falle 

• Die Berechtigung eines induktiven Schlusses ist umso hoher, 

- je groBer die Variability der bisherigen positiven Falle ist und 

- je kleiner die Variability der bisherigen negativen Falle ist. 

Je groBer die Zahl der Merkmale ist, in denen sich die bisherigen positiven Falle 
unterscheiden und je groBer die Unterschiede auf diesen divergierenden Merkmalen 
sind, desto stabiler ist der betrachtete Merkmalszusammenhang und desto 
berechtigter ist der Schluss, dass sich dieser Zusammenhang auch bei dem noch nicht 

90S 

betrachteten Fall zeigen wird. 

Diese Variability unter den bisherigen Fallen beeinflusst die Berechtigung des 
induktiven Schlusses nur insofern, als sie sich auf Merkmale bezieht, die fur den 
betrachteten Zusammenhang relevant sind. Dies zu beurteilen, erfordert Hintergrund- 
wissen dariiber, welche Merkmale fur die betrachteten Variablenzusammenhange 
relevant zu sein pflegen. 



205 



Thagard & Nisbett (1982), Cohen (1989), Kmse (1997) 
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0 Wenn die ersten fiinf untersuchten Studenten enge Freunde aus der gleichen Schulklasse 
sind, ist die Berechtigung einer induktiven Verallgemeinerung der Befunde auf andere 
Studierende geringer als wenn sie sich in Herkunft, Alter und Geschlecht stark 
unterscheiden. 

Ahnlichkeit neuer und bisheriger Falle 

• Die Berechtigung eines induktiven Schlusses ist umso hoher, 

• • 

- je groBer die Ahnlichkeit zwischen den neuen und den bisherigen positiven 
Fallen und 

• • 

- je kleiner die Ahnlichkeit zwischen den neuen und den bisherigen negativen 
Fallen ist. 

• • 

Die Ahnlichkeit der Falle ist dabei umso hoher, je mehr Merkmale oder Merkmals- 
auspragungen sie gemeinsam haben und je weniger ihre Merkmale oder 
Auspragungen divergieren. Merkmale werden dabei in dem MaBe beachtet und 
gewichtet, in dem sie fur die betrachteten Zusammenhange relevant sind. Diese 
Relevanz wiederum muss auf der Basis des vorhandenen theoretischen und 
praktischen Wissens bestimmt werden. 

0 Ist der Vorlesungsteilnehmer 99 weit alter und berufserfahrener als die iibrigen Studenten 
(z.B. ein Teilnehmer eines Seniorenstudiums), ist die Berechtigung von A5 => 199 
geringer als im Falle eines typischen Studenten, falls es theoretische oder empirische 
Hinweise darauf gibt, dass berufserfahrene Senioren andere Attributionsstile haben als 
Zwanzigjahrige. Die Berechtigung wird aber beispielsweise nicht beeinflusst, wenn von 
der Person 99 nur bekannt ist, dass sie die einzige Berlinerin unter den Studierenden ist 
und wenn es keine Hinweise darauf gibt, dass Berliner andere Attributionsstile haben. 

Grad der Bestatigung von Hypothesen 

Der Grad der Bestatigung einer Hypothese oder Theorie soil das AusmaB 
bezeichnen, in dem sie durch die vorliegenden empirischen Beobachtungen gestutzt 
wird. Nach den syntaktischen Rechtfertigungen der Induktion wird der Grad der 
Bestatigung einer Hypothese mit ihrer (personellen oder logischen) 
Wahrscheinlichkeit gleichgesetzt. Diese ist vor allem von der Zahl der bisherigen 
positiven Falle abhangig. Adaquater scheint es, bei der Explikation des 
Bestatigungsbegriffs alle Faktoren zu beriicksichtigen, die nach unserer 
pragmatischen Analyse die Berechtigung eines induktiven Arguments beeinflussen: 

• Der Grad der Bestatigung einer Hypothese oder Theorie durch die bisherigen 
Beobachtungen hangt von der Anzahl der hypothesenkonformen und -kontraren 



206 

207 



Lenzen (1974), Gadenne (1994a, S. 418-424) 
siehe oben Kapitel 4.3.1 
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Untersuchungsergebnisse ab, von Validitat dieser Beobachtungen, ihrer 
Variabilitat und ihrer Ahnlichkeit zu den noch nicht beobachteten Fallen. 

Ceteris-paribus-Bedingungen 

Wenn wir in den vorausgegangenen Absatzen den Einfluss verschiedener Faktoren 
auf die Berechtigung eines induktiven Schlusses bzw. die induktive Bestatigung 
einer Hypothese beschrieben haben, geschah dies unter der stillschweigenden 
Annahme, dass alle anderen moglichen Einflussfaktoren konstant sind. Eine 
derartige Konstanzannahme wird als Ceteris-paribus-Bedingung bezeichnet. 

Wenn mehrere Einflussfaktoren gleichzeitig und gegensinnig variieren, kann man 
hingegen keine Aussagen iiber den resultierenden Gesamteffekt machen. 

9 Wird der Anteil der external attribuierenden Teilnehmer, d.h. der positiven Falle, groBer, 
nimmt aber gleichzeitig auch die Variabilitat der negativen (internal attribuierenden) 
Falle zu, kann nicht sicher entschieden werden, ob die Berechtigung insgesamt steigt, 
fallt oder gleich bleibt. 

Wenn man jeweils voraussetzt, dass es keine gegensinnig wirksamen Faktoren gibt, 

• • 

konnen die Uberlegungen in den vorangegangenen Absatzen zu konkreten Aussagen 

• • 

iiber die Wirkung von Anzahl, Validitat, Variabilitat und Ahnlichkeit auf 

9 1 0 

Berechtigungen und Bestatigungen zusammengefasst werden: 

• Die Berechtigung eines induktiven Schlusses und die Bestatigung der 
entsprechenden Hypothese wird vergroBert, 

- wenn bei den positiven Fallen mindestens einer der vier Faktoren erhoht wird, 
wenn bei ihnen keiner der anderen Faktoren vermindert wird und 

wenn bei den negativen Fallen keiner der Faktoren erhoht wird. 

- wenn bei den negativen Fallen mindestens einer der Faktoren vermindert wird, 
wenn bei ihnen keiner der anderen Faktoren erhoht wird und 

wenn bei den positiven Fallen keiner der Faktoren vermindert wird. 

• Die Berechtigung eines induktiven Schlusses und die Bestatigung der 
entsprechenden Hypothese wird verkleinert, 

- wenn bei den positiven Fallen mindestens einer der Faktoren vermindert wird, 
wenn bei ihnen keiner der anderen Faktoren erhoht wird und 

wenn bei den negativen Fallen keiner der Faktoren vermindert wird. 

- wenn bei den negativen Fallen mindestens einer der Faktoren erhoht wird, 
wenn bei ihnen keiner der anderen Faktoren vermindert wird und 

wenn bei den positiven Fallen keiner der Faktoren erhoht wird. 



208 

Die Ahnlichkeit zwischen alien beobachteten und noch nicht beobachteten Anwen- 
dungsfallen ist generell um so groBer, je reprasentativer die bisherigen Falle sind. 

209 siehe unten Kapitel 7.2.4 

210 

Die vier Faktoren beeinflussen auch die empirischen Urteile von Personen zur 
Berechtigung eines induktiven Schlusses (Gerjets, Westermann & Liitkemeier, 1994). 
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Die identifizierten Berechtigungsfaktoren verdeutlichen das bestandige Risiko, dass 

induktive Schllisse aufgrund spaterer Erkenntnisse aufgegeben oder modifiziert 

werden miissen. Die Unsicherheit und die Vorlaufigkeit des Wissens sind 

wesentliche Kennzeichen jeder empirischen Wissenschaft. 

• • 

Uberlegungen zur Berechtigung induktiv verallgemeinernder Aussagen in der 
Wissenschaft konnen nicht zu (absoluter) Sicherheit fur diese Generalisierungen 
fiihren, sondern sie konnen nur dazu animieren, sich bei der Formulierung induktiver 
Schllisse so rational wie moglich zu verhalten: Man muss bewusst moglichst alle 
Faktoren beachten, von denen es nach bisherigem Wissen abhangen konnte, ob die 
Konklusionen sich gegebenenfalls tatsachlich als wahr herausstellen. 





5 Bedeutung und Definition 



In jedem wissenschaftlichen Fach miissen zur Beschreibung und Erklarung der 

interessierenden Phanomene bestimmte Begriffe neu eingefiihrt oder bekannte 

211 

Begriffe in einer speziellen Bedeutung verwendet werden. 

0 In der Psychologie ist der Begriff des „Leistungsmotivs“ neu eingefiihrt worden. Die 
Begriffe der „Einstellung“ und des „Wissens“ werden in anderer Bedeutung verwendet 
als in der Alltagssprache. 212 

Durch fachspezifische Begrifflichkeiten bekommen wissenschaftliche Aussagen eine 
genauere Bedeutung. Dies erleichtert die kritische Diskussion von 
wissenschaftlichen Ideen und Befunden, aber auch die Ableitung von Folgerungen 
und Vorhersagen, die praktisch anzuwenden oder empirisch zu Iiberprufen sind. 

Sprachliche Begriffe sind, allgemein gesagt, Zeichen oder Symbole. Andere 
Zeichen, die wir verwenden, sind Gesten, Verkehrsschilder, Piktogramme, 
Abkiirzungen usw. Die Semiotik, die wissenschaftliche Disziplin, die sich mit 
Zeichensystemen beschaftigt, hat drei Teile und Gegenstandsbereiche: 213 

• die Syntax, d.h. die Beziehungen zwischen den Zeichen untereinander, 

• die Semantik, d.h. die Beziehungen zwischen den Zeichen und dem Bezeichneten, 

• die Pragmatik, d.h. die Beziehung zwischen den Zeichen und ihrer Verwendung. 

Wenn wir nach der Bedeutung eines Begriffs oder eines anderen Zeichens fragen, so 
wollen wir, grob gesprochen, wissen, fur was dieses Zeichen steht, was sein Sinn ist, 
auf was es hinweist. In der Sprachphilosophie und Sprachwissenschaft gibt es zwei 
grundsatzlich verschiedene Vorstellungen dariiber, wie die Bedeutung von Begriffen 
zu analysieren und festzulegen ist: 214 



911 Die Entwicklung spezieller Sprachen ist keine Besonderheit der Wissenschaften. Eigene 
Jargons finden sich auch bei Motorradfahrern, Musikern, Jagern usf. 

212 

So spricht man im Alltag von „Wissen“, wenn etwas (relativ) sicher und bewusst ist, 
wahrend in der Kognitionspsychologie zum „Wissen“ auch (falsche) Meinungen und 
(unbewusste) Fertigkeiten gehoren (siehe z.B. Anderson, 1996a, S. 229-230). 

213 Morris (1988), Regenbogen & Meyer (1998, S. 599-600) 

214 Regenbogen & Meyer (1998, S. 94), Theorien der Bedeutung: Speck (1980, S. 49-59) 
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• Die realistische Bedeutungstheorie geht davon aus, dass die Bedeutung eines 
Begriffs durch den Sachverhalt bestimmt wird, auf den er verweist. 

• Die Gebrauchstheorie der Bedeutung geht davon aus, dass die Bedeutung eines 
Begriffs durch die Art seines Gebrauchs bestimmt wird. 

Die realistische Bedeutungstheorie wird allgemein in der Semantik vorausgesetzt 
und vor allem von den Logischen Empiristen vertreten. Die Gebrauchstheorie ist der 
Pragmatik zuzurechnen und geht auf die Spatwerke von Ludwig Wittgenstein 
zurtick. 

Nach der ublichen realistisch-semantischen Betrachtungsweise wird die 
Bedeutung eines Begriffs durch seine Intension und seine Extension bestimmt 
(Kapitel 5.1). Die Bedeutung wissenschaftlicher Begriffe kann auf unterschiedliche 
Weise und mit unterschiedlicher Prazision festgelegt werden: durch explizite 
Definitionen (Kapitel 5.2), durch operationale und bedingte Definitionen (Kapitel 
5.3) und durch Explikationen (Kapitel 5.4). Aus pragmatischer Sicht wird 
Bedeutung vor allem durch paradigmatische Anwendungen bestimmt (Kapitel 
5.5). 216 

5.1 Intension und Extension von Begriffen 

• Die Extension (auch Referenz oder Denotation ) eines Begriffs ist gleich der 
Menge der Objekte, die „unter diesen Begriff fallen“, d.h. die mit diesem Begriff 
bezeichnet werden konnen. 

0 Die Extension des Begriffs „Sozialphobiker“ umfasst die Menge aller Personen, die 
Sozialphobiker sind, d.h. auf die das Pradikat „ist Sozialphobiker“ zutrifft. 

Entspricht ein Begriff einem zwei- oder dreistelligen Pradikat, besteht die Referenz- 
menge aus geordneten Paaren oder Tripeln. 

0 Die Extension des Begriffs „Angstausloser“ umfasst alle Paare von Personen und 
Objekten, die die Aussageform „Objekt o lost bei Person p Angst aus“ erfullen. 

Zwei Begriffe haben die gleiche extensionale (oder referentielle, denotative) 
Bedeutung, wenn ihre Objektmengen identisch sind. 

0 Wenn die Menge der Phanomene, auf die das Pradikat „ist eine Sozialphobie“ zutrifft, 
genau gleich der Menge der Phanomene ist, auf die das Pradikat „ist eine soziale Angst- 



215 

In der Philosophic gibt es unterschiedliche Auffassungen dartiber, welche dieser 
verschiedenen Arten von Bedeutungsfestlegungen tatsachlich als Definitionen zu 
bezeichnen sind (Schischkoff, 1974; Seiffert & Radnitzky, 1989; Speck, 1980). 

216 Die folgenden Darstellungen basieren teilweise auf Hempel (1974), Groeben & 
Westmeyer (1975, S. 43-59), MittelstraB (1995a), Regenbogen (1998, S. 134-135), 
Speck (1980, S. 124-128, 217-222) und Sprung & Sprung (1987, S. 68-81). 
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storung“ zutrifft, haben die Begriffe „soziale Angststorung“ und „Sozialphobie“ die 
gleiche extensionale Bedeutung. 217 

Die Objektmengen zweier Begriffe konnen sich auch iiberschneiden, so dass einige 
Objekte unter beide Begriffe fallen. 

0 Die extensionalen Bedeutungen der Begriffe „Sozialphobiker“ und ..Depressive” 
iiberschneiden sich, da einige Menschen sowohl sozialphobisch wie depressiv sind. 

Wenn alle Objekte, die unter einen Begriff A fallen, auch unter den Begriff B fallen 
und wenn es zumindest einige Objekte unter B gibt, die nicht unter A fallen, dann ist 
B extensional ein Oberbegriff von A. 

0 Da alle sozialen Phobien unter die Angststorungen fallen, aber die Angststorungen nicht 
nur Soziale Phobien umfassen (sondern z.B. auch Agoraphobien und Panikstorungen), ist 
„Angststorung“ ein Oberbegriff zu „Soziale Phobie“. 

• Die Intension (oder der Inhalt , der Sinn ) eines Begriffs ist gleich der Menge der 
Attribute, die ein Objekt besitzen muss, um unter diesen Begriff zu fallen . 218 

0 Eine Soziale Phobie ist vor allem dadurch gekennzeichnet, dass die betreffende Person 
vor oder in bestimmten sozialen oder Leistungssituationen (z.B. Party, Referat, Einkauf) 
eine anhaltende, ausgepragte, unangemessene und beeintrachtigende Angst empfindet, 
sich zu blamieren. 219 

Wenn zwei Begriffe die gleiche intensionale Bedeutung haben, haben sie 
zwangslaufig auch gleiche Extensionen. Die Umkehrung gilt jedoch nicht unbedingt: 
Extensional gleiche Begriffe konnen intensional verschiedene Bedeutung haben. Sie 
konnen dann nicht ohne weiteres gegeneinander ausgetauscht werden. 

0 Durch die Begriffe „Gefangnisinsassen“, „Haftlinge“ und „Knackis“ wird extensional die 
gleiche Menge von Personen bezeichnet, sie werden aber mit unterschiedlicher 
intensionaler Bedeutung verwendet. Beispielsweise sind die Aussagen „Dein Freund sieht 
aus wie ein Knacki“ und „Dein Freund sieht aus wie ein Haftling“ fur uns in der Regel 
nicht gleichbedeutend. 



5.2 Explizite Deflnitionen 

Definiert werden konnen nicht nur Begriffe, sondern auch Aussagen oder Pradikate, 
also Aussagenteile. Bei einer expliziten Definition erfolgt die Bedeutungsfestlegung 



217 

Gleiche extensionale Bedeutung haben auch Abendstern und Morgenstern (siehe S. 46). 

218 Die Ausdrlicke meaning und sense werden in der Regel im Sinne der intensionalen 
Bedeutung gebraucht. Der Begriff der Intension darf nicht mit dem Begriff der Intention 
verwechselt werden. Intentionalitat im allgemeinen ist die Gerichtetheit mentaler 
Zustande (siehe oben Seite 40). In der Psychologie sind Intentionen gleichbedeutend mit 
Absichten (Fishbein & Ajzen, 1975; Heckhausen, 1989). 

219 DSM-IV (1996, S. 473-474) 
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dadurch, dass der zu definierende Ausdruck (das Definiendum ) mit anderen 
Begriffen oder Aussagen (dem Definiens) gleichgesetzt wird. 

Explizite Definitionen konnen unterschiedlichen Zwecken dienen. Zum einen 
kann das Definiendum ein bekannter Ausdruck sein, dessen Bedeutung durch das 
Definiens prazisiert werden soil. Zum anderen kann das Definiendum ein neuer 
Ausdruck sein, der an die Stelle eines bisherigen, meist langeren treten soli. 

Gebrauchsdefinition 

Bei der expliziten Definition einer Aussage (dem Definiendum) wird ihre aussagen- 
logische Aquivalenz mit einer anderen Aussage (dem Definiens) festgelegt. 

(5-1) Definiendum Definiens. 

Dies wird als Kontext- oder Gebrauchsdefinition bezeichnet, weil dabei ein 
interessierendes Pradikat im Kontext einer ganzen Aussage definiert wird. 

In psychologischen Texten finden sich zahlreiche explizite Definitionen von 
Begriffen oder Aussagen, auch wenn sie gar nicht als solche gekennzeichnet sind: 221 

0 „Jedes Ereignis, das in angemessener Verbindung mit einem Verhalten ... auftritt und 
dessen Starke erhoht oder aufrecht erhalt, wird ein Verstarker genannt.“ 222 
0 „Zwei Elemente, die in der Kognition einer Person bestehen und fiireinander relevant 
sind ..., ... stehen in einer dissonanten Beziehung zueinander, wenn ... das Gegenteil des 
einen Elements aus dem anderen folgt.“ 223 

In diesen Zitaten werden die Aussagen bzw. Pradikate „ist ein Verstarker“ und „sind 
dissonant“ definiert. 224 Indirekt werden damit auch die Begriffe „Verstarker“ und 
„Dissonanz“ definiert: als Klassen aller Objekte, auf die das jeweilige Pradikat 
zutrifft. Um dies zu verdeutlichen, formulieren wir das erste Beispiel (ohne den Sinn 
zu andern) um und heben die Pradikate in Definiendum und Definiens hervor: 

0 Ereignis x ist ein Verstarker wenn und nur wenn gilt: Ereignis x tritt in angemessener 
Verbindung mit einem Verhalten auf und erhoht dessen Starke oder erhalt sie aufrecht. 

Nominaldefinition 

Die explizite Definition eines Begriffs wird als Nominaldefinition bezeichnet. 225 

0 Der Erwartungswert E(X) einer diskreten Zufallsvariablen X, die die moglichen Werte 
Xi, x 2 , x n mit Wahrscheinlichkeiten p 1? p 2 , ... , p n annimmt, ist wie folgt definiert: 



220 

221 

222 

223 

224 

225 

226 



Statt durch : <-> wird die definitorische Aquivalenz auch durch ^->def bezeichnet. 
systematische explizite Definitionen psychologischer Begriffe: Smedslund (1997) 
Bredenkamp & Wippich (1977, S. 53) 

Festinger (1978, S. 25-26) 

Streng genommen handelt es sich hier nur um Aussageformen (siehe oben Seite 77). 
symbolisiert durch := oder = de f. 

Rasch (1995, S. 68), Reinhardt & Soeder (1978, S. 471) 
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(5-2) E(X):=£x iPi . 

i=l 

Viele Nominaldefinitionen erfolgen nach dem klassischen Schema von Aristoteles 
fur die Definition von Artbe griff en\ 

• Die Definition erfolgt durch Angabe seiner nachsthoheren Gattung ( genus 

997 

proximum ) und des artunterscheidenden Merkmals ( differentia specifica). 

0 „Handeln ist nach Weber alles menschliche Verhalten, mit dem der Handelnde einen 
’Sinn’ verbindet“ 228 

0 Eine Verhaltenstherapie ist als eine psychotherapeutische Vorgehensweise definiert, die 

229 

auf lernpsychologischen Erkenntnissen beruht. 

Durch Nominaldefinition eines Artbegriffs wird eine Menge von Merkmalen 
spezifiziert, die zwei Eigenschaften hat. 

Erstens sind alle Merkmale zusammen hinreichend fur die Einordnung eines 
Objektes unter diesen Begriff: Wenn ein Objekt alle diese Merkmale besitzt, muss es 
zwangslaufig der entsprechenden Kategorie (Art) zugeordnet werden. 

Zweitens ist jedes dieser Merkmale einzeln notwendig fur die Einordnung eines 
Objektes in die durch diesen Begriff bezeichnete Kategorie (Art). Die Merkmale sind 
alien Objekten gemeinsam, die unter diesen Begriff fallen. Besitzt ein Objekt eines 
dieser Merkmale nicht, fallt es nicht unter diesen Begriff. 

0 Eine Vorgehensweise, die auf lernpsychologischen Erkenntnissen beruht, aber keine 
psychotherapeutische Vorgehensweise ist (sondern z.B. der Mitarbeiterfuhrung dient), ist 
nach der obigen Definition keine Verhaltenstherapie. 



Eigenschaften von Definitionen 



Eine Aussage ist nur dann eine Definition, wenn sie zwei Kriterien geniigt: 
Eliminierbarkeit und Nicht-Kreativitat. 



Ein definierter Begriff ist insofern eliminierbar, als er im Prinzip durchgangig durch 
das Definiens ersetzt werden konnte, ohne dass sich der Wahrheitswert der 

990 

entsprechenden Aussagen verandert. 

Eine Definition ist insofern nicht-kreativ , als sie eine rein begriffliche Operation 
ist. Definitionen bringen Klarheit und Ordnung in unsere Begrifflichkeit, sie dtirfen 
aber nicht mit Erkenntnissen liber die Welt auBerhalb dieses Begriffssystems 
verwechselt wirden. Definiert jemand einen Begriff oder eine Aussage, kann diese 
Definition deshalb nicht empirisch wahr oder falsch sein. 



227 

228 

229 
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Dass nicht alle Nominaldefinitionen nach diesem Schema erfolgen, zeigt Beispiel (5-2). 
Heckhausen (1989, S. 13) 

Davison & Neale (1996, S. 52) 

Praktiziert wird eine derartige Elimination natiirlich nicht, denn das Definiendum wird 
ja haufig gerade als abkiirzende Bezeichnung fur ein unhandliches Definiens eingefiihrt. 
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0 Die Einstellung ( attitude ) einer Person zu einem Objekt wird als ihre Gesamtbewertung 

231 

dieses Objekts definiert. Damit wird etwas liber die Bedeutung dieses Begriffs 
mitgeteilt, aber nichts liber Straktur, Ursachen, Folgen und Funktionen von Einstel- 
lungen. 

Eine weitere wichtige Eigenschaft von Definitionen ist ihre Kontextabhangigkeit : 
Die Definition eines Begriffs oder einer Aussage erfolgt stets in Bezug auf eine 
bestimmte Begrifflichkeit oder Theorie. In anderen „Kontexten“ konnen andere 
Definitionen sinnvoll und notwendig sein. 

0 Vertreter der Rubikontheorie der Handlungsphasen definieren eine Handlung als die 
Menge zeitlich geordneter Aktivitaten, die fur die Erreichung eines Zieles relevant 
sind. Anders als bei Max Weber umfasst eine Handlung nach dieser Theorie nicht nur 
offene Verhaltensweisen, sondern beispielsweise auch abwagende, planende und 
bewertende Uberlegungen. 

Adaquatheit 

Eine Definition kann weder empirisch wahr noch empirisch falsch sein. Man kann 
sich aber natiirlich sehr wohl dariiber streiten, ob eine bestimmte Definition sinnvoll 
ist, ob sie mit anderen Definitionen vertraglich ist usf. Die Definition eines Begriffs 
wird insbesondere dann als inadaquat bezeichnet, wenn sie zu eng oder zu weit ist. 

• Zu eng ist eine Definition, wenn zu wenig Objekte unter den Begriff fallen. 

• Zu weit ist eine Definition, wenn zu viele Objekte unter den Begriff fallen. 

Beurteilt werden kann diese Adaquatheit einer Begriffsdefinition nur, wenn man 
bereits tiber Vorstellungen dariiber verfugt, dass bestimmte Objekte unter den 
Begriff fallen mlissen, andere aber nicht darunter fallen diirfen. 

0 Die Weltgesundheitsorganisation (WHO) hat „Gesundheit“ als „vollstandiges korper- 
liches, seelisches und soziales Wohlbefinden“ definiert. 233 Diese Definition ist zu eng, 
denn eine Person fallt nach dieser Definition bereits dann nicht mehr unter den Begriff 
„gesund“, wenn sie sich Liber ihren Vorgesetzten argert und sich deshalb seelisch und 
sozial nicht vollstandig wohl fiihlt. Wtirde man dagegen „Gesundheit“ beispielsweise als 
„Abwesenheit von korperlichem Beeintrachtigungen“ definieren, ware die Definition zu 
weit, weil man Personen, die psychisch schwer, korperlich aber nicht beeintrachtigt sind, 
nach dieser Definition als „gesund“ bezeichnen miisste. 

Zirke Ide f initio n 

Eindeutig inadaquat ist eine Definition dann, wenn sie zirkelhaft ist. Eine 
Zirkeldefinition liegt dann vor, wenn in der Definition eines Begriffs auf diesen zu 
definierenden Begriff selbst zuruckgegriffen wird. 



Fishbein & Ajzen (1975), Westermann (1982) 
Heckhausen (1989, S. 13) 

Waller (1995, S. 9) 
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0 „Vom Stand meines heutigen Wissens aus wiirde ich den Identitatsbegriff, der unserer 
Forschung zugrunde liegt, abschlieBend so definieren: 

Identitat ist ein Projekt, das zum Ziel hat, ein individuell gewiinschtes oder 
notwendiges ‘Gefiihl der Identitat’ ( sense of identity) zu erzeugen". 234 

Da derartige unmittelbare Zirkeldefinitionen so offensichtlich unbefriedigend sind, 
finden sie sich in der wissenschaftlichen Literatur gliicklicherweise selten. Schwerer 
zu entdecken und auszumerzen sind mittelbare Zirkeldefinitionen, bei denen im 
Definiens Begriffe verwendet werden, bei deren Definition wiederum mittelbar oder 
unmittelbar auf das urspriinglich zu definierende Wort zuriickgegriffen wird. 

0 Wiirde man „Gesundheit“ als „Abwesenheit von Krankheit“ und auBerdem „Krankheit“ 
als „Beeintrachtigung der Gesundheit“ definieren, lage eine (mittelbare) Zirkeldefinition 
vor. 

Undefinierte Grundbegriffe 

Explizite Definitionen finden sich vor allem in der Logik, der Mathematik und den 
klassischen Naturwissenschaften. Unklarheiten oder gar Kontroversen fiber die 
Bedeutung von Begriffen sind deshalb dort sehr selten. 

0 „Unter der Varianz V(X) einer ZufallsgroBe X versteht man den Erwartungswert 
E( (X-/j ) 2 )“ 235 oc j er kurzgefasst 

(5-3) V(X) := E[(X-p) 2 ]. 

Die Bedeutung des Begriffs der Varianz wird absolut prazise festgelegt, weil alle im 
Definiens auftretenden Begriffe (von den Begriffen der ZufallsgroBe und des 
Erwartungswertes bis hin zu den Klammern und Exponenten) bereits vorher prazise 
explizit definiert worden sind. Die in den jeweiligen Definiensien auftretenden 
Begriffe sind ihrerseits wiederum explizit definiert. In der Mathematik finden wir 
also ganze Ketten von expliziten Definitionen der interessierenden Begriffe. Es ist 
allerdings weder sinnvoll noch moglich, diese Definitionsketten in beide Richtungen 
unendlich lange fortzufiihren. Sie mitssen vielmehr an einer geeigneten Stelle 
abgebrochen werden. Deshalb baut sich jede mathematische Disziplin auf 
bestimmten undefinierten Grundbegriffen auf, z.B. „natiirliche Zahl“, „Punkt“ und 
„Gerade “. 236 

In einer empirischen Wissenschaft kann eine Definitionskette so lange in 
Richtung auf immer elementarere Begriffe fortgesetzt werden, bis man auf Begriffe 
stoBt, deren Bedeutung nicht mehr sprachlich festgelegt werden muss, sondern 



J Keupp (1997, S. 34) 

235 Reinhardt & Soeder (1978, S. 471) 

236 Reinhardt & Soeder (1978, S. 21, 53, 133). Man sagt haufig, dass diese Grundbegriffe 
dadurch implizit definiert werden, dass Annahmen liber die Beziehungen zwischen 
ihnen getroffen werden. Diese Bezeichnung ist jedoch irrefiihrend, da es sich dabei nicht 
um eine Definition der Begriffe im tiblichen Sinn handelt. 
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„aufzeigend“ ( ostentativ ) bestimmt werden kann, d.h. durch Verweis auf konkret 
existierende Objekte oder Ereignisse. 237 Tatsachlich werden die Definitionsketten 
meist viel friiher abgebrochen. Wie wir spater sehen werden, bleibt die Bedeutung 
der Grundbegriffe psychologischer Theorien meist undefiniert und wird nur grob 
durch Verweis auf andere Theorien oder den allgemeinen Sprachgebrauch 
umschrieben. Was als undefinierte und nicht weiter zu analysierende Begriffe 
verwendet wird, hangt vom Fachgebiet und dem Anwendungsbereich der Theorie ab. 

0 In einer volkswirtschaftlichen Theorie konnen ganze Betriebe (mit ihren Kapazitaten, 
Produkten usw.) als Grundbegriffe betrachtet werden, in der Betriebswirtschaftslehre die 
einzelnen Abteilungen eines Betriebes (mit ihren Aufgaben und Moglichkeiten), in der 
Organisationspsychologie die einzelnen Teilnehmer einer Arbeitsgruppe (mit ihren 
Merkmalen und Eigenschaften). 

0 In einer arbeitspsychologischen Theorie zu den Ursachen der Arbeitszufriedenheit 
konnen die verschiedenen Bediirfnisse der Menschen als Grundbegriffe verwendet 
werden, in der Motivationspsychologie wird Abgrenzung, Genese und Anregung dieser 
Bediirfnisse naher beschrieben und erklart. 

0 In der Motivations- und Lernpsychologie werden die betrachteten Reize (z.B. ein helles 
Licht als diskriminativer Hinweisreiz) undefiniert vorausgesetzt, in der Wahmehmungs- 
psychologie aber weiter analysiert. 

Begriffliche Vagheit 

Wie wir oben an den Beispielen gesehen haben, gleichen die expliziten Definitionen 
in der Psychologie in ihrem Aufbau den mathematischen Definitionen: Ein 
Definiendum (z.B. der Begriff „Dissonanz“ oder das Pradikat „sind dissonant“ oben 
auf Seite 104) wird jeweils mit einem bestimmten Definiens gleichgesetzt. Auch sind 
die Begriffe im Definiens entweder allgemein bekannt und verstandlich oder vorher 
bereits naher umschrieben worden. 

Der wesentliche Unterschied zu Definitionen in der Mathematik und anderen 
formalen Wissenschaften besteht in der geringeren Prazision der Definitionen, die 
wir in der Psychologie oder anderen Natur- und Sozialwissenschaften finden: Nach 
der Definition verbleibt immer noch eine erhebliche Vagheit, weil die verwendeten 
Begriffe mit den Unklarheiten der Umgangs- oder Fachsprache behaftet sind. 

0 Es ist schwierig, genau die hinreichenden Bedingungen daftir anzugeben, wann fur eine 
Person tatsachlich eine Kognition aus dem Gegenteil einer anderen folgt oder wann sie 
mit ihrem Verhalten einen Sinn verbindet: Sollen wir das Verhalten der Person 
beobachten oder sie fragen? Wird die Person uns eine unverfalschte Antworten geben 
wollen und konnen? Wie lange bleibt ein festgestellter Zustand bestehen? 

AuBerdem werden psychologische Begriffe in verschiedener Bedeutung verwendet. 



237 

238 



Seiffert & Radnitzky (1989, S. 31) 

Festinger erlautert vorher, dass er unter kognitiven Elementen alle Kenntnisse und 
Meinungen der Person uber sich selbst und ihre Umwelt versteht (1978, S. 22-23). 
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0 Die meisten Autoren verstehen „induktives Denken“ als Ableitung allgemeiner Muster 

oder Regeln aus Einzelfallen, andere hingegen bezeichnen alle Denkprozesse als 

239 

induktiv, die nicht eindeutig deduktiv sind. 

Haufig schlagen sich Bedeutungsunterschiede nicht in expliziten Definitionen nieder, 
sondern darin, dass fiir die gleichen Konzepte in verschiedenen Theorien 
unterschiedliche Zusammenhangsannahmen gemacht werden. 

0 Nach zweifaktoriellen Theorien ist jede Emotion sowohl von einem unspezifischen 
physiologischen Erregungszustand als auch von Kognitionen iiber die erregungs- 
auslosende Situation abhangig. 

9 Nach attributiven Theorien sind Emotionen positive oder negative Erlebnisqualitaten mit 
bestimmten Intensitaten, denen Situationsbewertungen (Attributionen) vorausgehen. 
Physiologische, mimische und gestische Komponenten gehoren jedoch nicht 
notwendigerweise zu einer Emotion. 241 

9 Nach physiologischen Theorien konnen Emotionen sowohl ohne unspezifische periphere 
Aktivierungen als auch ohne bewusste Wahrnehmungen, Kognitionen oder Attributionen 
auftreten. 242 

Derartige begriffliche Divergenzen werden zum Teil offen angesprochen und 
diskutiert, haufig bleiben sie aber unbemerkt. Dies ftihrt zu Kommunikations- und 
Verstandigungsschwierigkeiten: Wenn verschiedene Personen das gleiche Wort in 
unterschiedlicher Bedeutung verwenden, haben sie oft das Geftihl, sich gegenseitig 
gut zu verstehen, obwohl sie tatsachlich aneinander vorbei reden. 

Offenheit von Begriffen 

Die Vagheit psychologischer Begriffe hat aber nicht nur Nachteile. Wenn die 

Bedeutung eines Begriffes zunachst nur sehr grob umrissen ist, kann sie in 

• • 

Abhangigkeit von eingehenderen Untersuchungen und Uberlegungen genauer 
spezifiziert werden. Teilweise bildet sich die scharfere Bedeutung eines Begriffs 
auch erst allmahlich und fast unmerklich im Laufe der Verwendung heraus. 

0 Nach experimentellen Ergebnissen treten die von der Dissonanztheorie vorhergesagten 
Effekte nur auf, wenn die sich widersprechenden Kognitionen von erheblicher Relevanz 
sind, insbesondere wenn durch den Widerspruch eine Selbstverpflichtung der Person 
(< commitment ) entsteht oder ihr Selbstkonzept tangiert wird. Seit diesen Erkenntnissen 
ist es sinnvoll, von Dissonanz nur noch zu sprechen, wenn nicht nur ein kognitiver 
Widerspruch vorliegt, sondern auch das Selbst der Person betroffen ist. 244 



239 

240 

241 

242 

243 

244 



z.B. Krause (1990) und Klauer (1993) vs. Holland, Holyoak, Nisbett & Thagard (1986) 
Schachter (1964), Meyer, Schutzwohl & Reisenzein (1993, S. 111-115) 

Weiner (1986), Meyer et al. (1993, S. 169) 

Ohman (1988), Birbaumer & Schmidt (1999, S. 647) 

Aronson (1969), Brehm & Cohen (1962), Irle (1975), siehe unten Abschnitt 11.4.2 
Greenwald & Ronis (1978), Westermann (1987a, S. 150) 
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0 Der Begriff der Kreativitat wird seit jeher in unterschiedlichen Bedeutungen verwendet, 
es scheint sich aber allmahlich durchzusetzen, dass man eine Aufgabenlosung nur dann 
als kreativ bezeichnen kann, wenn sie nicht nur neu, ungewohnlich oder iiberraschend ist, 
sondern auch eine sachlich adaquate Problemlosung darstellt. 245 

Da wissenschaftliche Begriffe oft nicht von vornherein eindeutig und explizit 
definiert sind, besteht ein wesentlicher Teil des Studiums eines Wissenschaftsgebiets 
darin, die Bedeutung der gebrauchlichen Begriffe immer besser zu erfassen. 246 



5.3 Operationale und bedingte Definitionen 

Um jede Vagheit zu vermeiden, haben Vertreter des Logischen Empirismus 
urspriinglich operationale Definitionen fur alle wissenschaftlichen Begriffe und 
Variablen gefordert: Die Bestimmung von Begriffszugehorigkeiten und Variablen- 
auspragungen sollte nach genauen Kriterien erfolgen, die sich auf eindeutig 

947 

beobachtbare Sachverhalte beziehen. 

Die operationale Definition darf nicht mit der Operationalisierung im 
Allgemeinen verwechselt werden. Als Operationalisierung bezeichnet man jede 
Zuordnung (moglicher) Beobachtungen (auch als Indikatoren, Manifestationen usw. 
bezeichnet) zu einer theoretischen, unbeobachtbaren Variablen. Die operationale 
Definition ist also nur eine mogliche Art der Operationalisierung, nach streng 
empiristischer Auffassung ist sie aber die einzig sinnvolle. 

In der Psychologie ist die Idee der „ostentativen“ Bedeutungsfestlegung durch 
operationale Definition vor allem durch die Behavioristen verfolgt worden. 248 

0 In der Lerntheorie von Hull ist beispielsweise die Habitstarke S H R (d.h. die Tendenz des 
Reizes S, die Reaktion R auszulosen) prazise als Funktion der Anzahl N der bisherigen 
verstarkten Lerndurchgange definiert: 249 

(5-4) s H r := i-io 0 0395N . 

5.3.1 Operationale Definition von Dispositionsbegriffen 

Ein entscheidender Nachteil von operationalen Definitionen zeigt sich bei sog. 
Dispositionsbegriffen. 250 Sie bezeichnen die Fahigkeit oder Neigung einer Person 



245 

246 



247 

248 

249 



Amabile (1983), Kuhlmei (1993) 

Wenn die Aufgabe nicht darin besteht, einen Begriff neu zu definieren, sondern wenn 
herauszufinden ist, wie ein Begriff oder Ausdruck in einer Sprachgemeinschaft definiert 
ist, spricht man von einer Bedeutungsanalyse ( meaning analysis ) oder (etwas 
irrefiihrend) von einer beschreibenden Definition (Opp, 1976, S. 199-201; Seiffert & 
Radnitzky, 1989, S. 29). 

Bridgman (1927) 

Bower & Hilgard (1983), Foppa (1965) 

Foppa (1965, S. 341-342) 
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oder eines Objektes, in bestimmten Situationen auf bestimmte Weise zu reagieren. 
Wenn wir beispielsweise die Aussage ,, dieses Glas ist zerbrechlich“ haben, ist 
„zerbrechlich“ ein Dispositionspradikat: Wir sagen von dem Glas aus, dass es 
zerbricht, falls es in bestimmtem MaBe belastet wird. Falls keine entsprechende 
Belastung auftritt, tritt auch die Eigenschaft der Zerbrechlichkeit nicht offen hervor. 

Zu den Dispositionsbegriffen gehoren auch die Personlichkeitsmerkmale {traits), 
mit denen wir in der Psychologie Personen charakterisieren. 251 

0 Wenn wir eine Person als hochintelligent bezeichnen, meinen wir, dass sie in 
entsprechenden intellektuellen Leistungssituationen weit bessere Ergebnisse produziert 
als andere Personen. In anderen Situationen muss diese Eigenschaft nicht manifest 
werden. 

Operational definiert werden kann ein Dispositionsbegriff D folgendermaBen: Die 
Aussage, dass ein Objekt p die Eigenschaft D hat, wird Equivalent gesetzt zu der 
Aussage, dass die Person p ein bestimmtes Verhalten V zeigt, wenn sie in einer 
bestimmten Situation S ist: 

(5-5) D(p) :<-» [S(p) V(p)]. 

0 Um das Pradikat „hochintelligent“ operational zu definieren, miissen wir festlegen, 
welches Verhaltensergebnis (z.B. Intelligenzquotient iiber 130) eine Person bei welcher 
Test- oder Aufgabensituation (z.B. Intelligenz-Stmktur-Test IST 2000 252 ) mindestens 
erreichen muss, um als hochintelligent bezeichnet zu werden. 

Operationale Definitionen der Form (5-5) sind allerdings mit einem grundsatzlichen 
logischen Defekt behaftet. Aus ihnen ergibt sich logisch zwingend, dass man die 
betreffende Eigenschaft nicht nur den Objekten zuschreiben muss, die unter der 
Testbedingung S das Verhaltensergebnis V zeigen, sondern auch alien Objekten, die 
gar nicht der Testbedingung S unterworfen worden sind. Ist namlich S(p) falsch, ist 
die Aussage S(p) — > V(p) (nach der Definition der Implikation in Tabelle 3.2) stets 
wahr. Dann ist aber auch der nach (5-5) zu dieser Implikation aquivalente Ausdruck 
D(p) stets wahr. D(p) ist also stets wahr, wenn S(p) falsch ist. 

0 Wird das Pradikat „hochintelligent“ operational definiert, miissen wir auch alle Personen 
als „hochintelligent“ bezeichnen, die den Intelligenztest uberhaupt nicht gemacht haben. 

Diese Konsequenz ist natiirlich inhaltlich nicht sinnvoll. Die aussagenlogisch 
formulierte operationale Definition kann deshalb nicht als adaquat angesehen 
werden. 



Carnap (1936, 1937), Herrmann (1973), Stegmiiller (1974) 
251 Herrmann (1973), Brocke (2000) 

Amthauer, Brocke & Liepmann (1998) 
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5.3.2 Einftihrung von Dispositionsbegriffen durch Reduktionssatze 

Ausgeglichen werden kann dieser Mangel, indem man die Bedeutung eines 
Dispositionspradikats durch eine bedingte operationale Definition festlegt, die als 
Reduktionssatz bezeichnet wird: 

(5-6) S(p) -> [D(p) :<-> V(p)] 

Das Dispositionspradikat D wird nicht mehr vollstandig, sondern nur noch partiell 
definiert: nur fur die Personen, die tatsEchlich der Testsituation S unterworfen 
worden sind. Fiir sie ist die Disposition D explizit definiert, indem sie mit dem 
Verhaltensergebnis V Equivalent gesetzt wird. Fiir alle anderen ist D nicht definiert. 

Unilaterale und bilaterale Reduktionssatze 

Wenn wie in (5-6) Disposition und Verhalten Equivalent gesetzt werden, spricht man 
von einem bilateralen Reduktionssatz. Wird das Verhalten nur als hinreichende oder 
nur als notwendige Bedingung fur die Disposition definiert, liegen unilaterale 
ReduktionssEtze vor. Soil das Verhalten hinreichend fiir die Zuschreibung der 
Disposition sein, entspricht das dem Reduktionssatz 

(5-7) S(p) [V(p) — » D(p)]. 

Will man dagegen das Verhalten als eine notwendige Bedingung fiir die Disposition 
betrachten, hat man den Reduktionssatz 

(5-8) S(p) > [D(p) — » V(p)]. 

In diesem Fall folgt aus dem kritischen Verhalten nicht unbedingt das Vorliegen der 
Disposition. Zeigt die Person in der Testsituation S das Verhalten V aber nicht, folgt 
daraus, dass sie definitionsgemEB auch nicht die Disposition D hat. 

Probabilistische Reduktionssatze 

GrundsEtzlich sind ReduktionssEtze streng deterministisch formuliert. Wir mtissen 
also z.B. die Person p als hochintelligent bezeichnen, wenn sie das festgelegte 
kritische Verhaltensergebnis V in der Testsituation S zeigt, obwohl wir wissen, dass 
ein derartiges Testergebnis auch einmal zufEllig zustande gekommen sein kann. 
Deshalb kann es sinnvoll sein, ReduktionssEtze probabilistisch zu formulieren. 253 
Der deterministischen Aussage (5-7) beispielsweise, nach der das Verhalten V hin- 
reichend fiir die Zuschreibung der Disposition D ist, entspricht dem probabilistischen 
Reduktionssatz 

(5-9) S(p) [P(D(p) |V(p)) = p]. 254 



Stegmuller (1983, S. 162) 

254 

Wenn eine Person der Testbedingung S unterworfen worden ist, dann hat sie, falls sie 
das kritische Verhalten V zeigt, nach dieser bedingten Definition mit einer bestimmten 
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Mehrfache Reduktionssatze 

Bei den bisher vorgestellten Formen von operationalen Definitionen und Reduktions- 
satzen wird nicht die Tatsache beriicksichtigt, dass die Wissenschaftler keineswegs 
nur eine einzige Erfassungsmethode fur ein Dispositionspradikat akzeptieren. Sie 
wollen auch nicht fur jede Erfassungsmethode ein neues Dispositionspradikat 
benutzen. Sie akzeptieren vielmehr haufig mehr als eine Erfassungsmethode fur das 
gleiche Dispositionspradikat. 

0 Kein serioser Psychologe ist der Auffassung, dass Intelligenz sich allein und vollstandig 
durch die Ergebnisse in einem einzigen Test erfassen lasst. Hochst unbefriedigend ware 
es aber auch, fur jeden moglichen Intelligenztest einen separaten Intelligenzbegriff 
einzufuhren („IST 2000“-Intelligenz, „HAWIE-R“-Intelligenz usw.). Vielmehr herrscht 
die Vorstellung vor, dass die zahlreichen Intelligenztests jeweils (mehr oder minder) 
unterschiedliche Aspekte der menschlichen Intelligenz erfassen. 

Die (bedingte) Definition von psychologischen Dispositionspradikaten sollte deshalb 
in der Regel durch mehrere Reduktionssatze erfolgen, die sich auf unterschiedliche 
Situationen Si bis S n (d.h. z.B. n verschiedene Intelligenztests) und entsprechend 
viele Verhaltenskriterien Vj bis V n (z.B. bestimmte Mindestergebnisse) beziehen: 

(5-10) Sifo^PXp):**^)] 

• •• •••• ••• 

• •• •••• ••• 

S n (p) [D(p) :<-> V n (p)] 

0 Die Disposition ,,hochintelligent“ (H), kann durch zwei Reduktionssatze eingefiihrt 
werden, die sich auf die Durchfuhrung von HAWIE-R und IST 2000 beziehen und von 
der Person p jeweils einen IQ von mindestens 130 fordern: 

HAWIE(p) [H(p) :<-> HAWIE-IQ(p)> 130] 

IST(p) [H(p) IST-IQ(p)> 130]. 

Wird ein Begriff durch mehrere Reduktionssatze eingefiihrt, kann die Konsistenz 
dieser Bedeutung sspezifikation empirisch uberpruft werden. 

0 Aus den beiden Reduktionssatzen fur die Eigenschaft ,,hochintelligent“ folgt, dass 
Personen genau dann einen HAWIE-IQ von mindestens 130 haben, wenn sie auch einen 
IST-IQ von mindestens 130 haben. 

Wenn die Reduktionssatze deterministisch formuliert sind, konnen empirisch leicht 
Widersprtiche auftreten: Wenn eine Person in einer der Testsituationen das geforder- 
te Verhaltensergebnis zeigt, in einer anderen Testsituation aber nicht, mtisste ihr 



Wahrscheinlichkeit p die Disposition D. In der Psychologic konnen wir in der Regel nur 
GroBenordnungen von Wahrscheinlichkeiten angeben: Die Wahrscheinlichkeit, dass 
eine Person die Disposition hat, soil groBer sein, wenn sie das Verhalten V zeigt, als 
wenn sie es nicht zeigt: S(p) > [P(D(p) |V(p)) > P(D(p) I — >V(p))]- 
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einmal die Disposition zugeschrieben werden, das andere Mai aber nicht. 
Aufgefangen werden konnen diese Inkonsistenzen durch eine probabilistische 
Formulierung oder Interpretation der Reduktionssatze. 

0 Unsere Spezifikation des Begriffs „hochintelligent“ ist umso konsistenter, je weniger die 
empirischen Testergebnisse von der strengen Vorhersage abweichen. Allgemein ist die 
Operationalisierung von „Intelligenz“ durch eine Menge von Tests um so konsistenter, je 
hoher ihre Ergebnisse miteinander korrelieren, das heiBt je hoher ihre konvergente 
Validitdt ist. 

Reduktionssatze als Manifestationsgesetze 

Eine Menge von mehreren Reduktionssatzen zur Einfuhrung eines einzigen Begriffs 
kann auch als ein System von Aussagen mit empirischem Gehalt interpretiert 
werden. 255 GemaB (5-10) beispielsweise muss eine Person p, die in Situation Si die 
Verhaltensweise Vi zeigt und der dementsprechend die Disposition D zugeordnet 
wird, in der Situation S n die Verhaltensweise V n zeigen. Diese Vorhersage kann 
empirisch geprlift werden und sich dabei als wahr oder falsch herausstellen. 

Damit verschwimmt die herkommliche Unterscheidung zwischen Definitionen 
einerseits, die nicht wahr oder falsch sein konnen, und Gesetzesannahmen 
andererseits, die im Prinzip empirisch bewahrt oder falsifiziert werden konnen. Da 
die Einfuhrung eines theoretischen Begriffs durch mehrere Reduktionssatze 
empirisch gehaltvolle Komponenten beinhaltet, konnen diese Satze auch als spezielle 
Gesetzesannahmen betrachtet und als Manifestationsgesetze bezeichnet werden. 

• • 

Uberschussbedeutung 

Ein grundsatzliches Problem der Einfuhrung eines Begriffs durch eine operationale 

Definition oder durch eine Menge von Reduktionssatzen besteht darin, dass der so 

• • 

(bedingt) definierte Begriff keinerlei Uberschussbedeutung besitzt. Er ist nichts 

anderes als eine Kurzbezeichnung fur die Resultate von Tests oder Beobachtungen 

unter bestimmten Bedingungen. Dies konfligiert mit den Auffassungen der meisten 

Wissenschaftler: Fur sie umfasst die Bedeutung von Fachbegriffen in der Regel 

mehr, als in den Ergebnissen endlich vieler Beobachtungen zum Ausdruck kommen 

• • 

kann. Da diese Uberschussbedeutung aber nie genau definiert werden kann, bleiben 
die entsprechenden wissenschaftlichen Begriffe immer in bestimmtem AusmaB vage. 

0 Ein operational definierter Begriff der Intelligenz ist gleichbedeutend mit den 
Ergebnissen bestimmter Intelligenztests. Die Aussage „Intelligenz ist, was die 
Intelligenztests messen“ bringt dies zum Ausdruck. Sie wird haufig zitiert, um deutlich zu 
machen, dass eine operationale Definition von Begriffen wie Intelligenz nicht mit unseren 



255 



Eine Aussage hat, vereinfacht gesagt, empirischen Gehalt, wenn ihr Aussagen liber 
Beobachtbares widersprechen konnen (siehe unten Kapitel 10.2.2 und 11.7.3). 
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fachwissenschaftlichen Vorstellungen ubereinstimmt: Danach umfasst die Intelligenz 
einer Person mehr, als man mit den vorliegenden Intelligenztests erfassen kann. 

Angesichts dieser Schwierigkeiten ist auch der Logische Empirismus schlieBlich von 
der Forderung nach operationalen oder bedingt-operationalen Definitionen fur alle 
wissenschaftlichen Begriffe abgeriickt. 256 Es wird statt dessen zwischen zwei 
Klassen von Begriffen unterschieden: theoretische Begriffe und Begriffe fur direkt 
Beobachtbares. 

Operationale und bedingte Definitionen spielen beim systematischen Aufbau der 
theoretischen Begrifflichkeit eine wichtige Rolle, es wird aber nicht verlangt, dass 
alle theoretischen Begriffe mit Hilfe von empirischen Begriffen eindeutig definiert 
werden. Vielmehr werden verschiedene Formen von Zuordnungsregeln zwischen 
theoretischen und empirischen Begriffen zugelassen, und die Festlegung der 
Bedeutung von wissenschaftlichen Begriffen wird untrennbar mit der Aufstellung 
und empirischen Prufung der zugehorigen Theorien verbunden. Diese sehr bekannte 
und fast zum Standard gewordene Konzeption zum Aufbau wissenschaftlicher 
Begrifflichkeiten und Theorien werden wir im einzelnen im Kapitel 11.1 betrachten. 

Wegen der vielfaltigen Schwierigkeiten, wissenschaftliche Begriffe in Disziplinen 
auBerhalb der Mathematik explizit zu definieren, sind fur die Psychologie und andere 
empirische Wissenschaften auch schwachere Methoden zur teilweisen Spezifikation 
der Bedeutungen von Begriffen von groBer Relevanz: die Explikation, die Angabe 
paradigmatischer Beispiele und die mengentheoretische Charakterisierung von 
Begriffen. Sie werden in den folgenden Kapiteln 5.4, 5.5 und 6 besprochen. 



5.4 Explikationen 

Von einer Explikation spricht man, wenn ein vorhandener Begriff (das 
Explikandum) durch einen ahnlichen, aber exakteren Begriff (das Explikat) ersetzt 
wird. 257 Im Unterschied zu einer Nominaldefinition werden die Begriffe bei einer 
Explikation nicht gleichgesetzt. Vielmehr wird das Explikat verwendet, um das 
Explikandum genauer zu erlautern oder zu verdeutlichen. 258 

Ein GroBteil der Ausfuhrungen in wissenschaftlichen Texten stellen in diesem 
Sinne Explikationen dar. Sie dienen dazu, die Bedeutung bestimmter vorhandener 
Begriffe zu beschreiben, indem andere, prazisere Begriffe verwendet werden. 



Carnap (1960), Hempel (1974) 

257 Groeben & Westmeyer (1975, S. 57-59), Opp (1976, S. 246-254), Seiffert & Radnitzky 
(1989, S. 73-80), Stegmuller (1969, S. 373-376) 

258 

In Abhebung von der Nominaldefinition (siehe oben Seite 104) spricht man oft von einer 
Realdefinition , wenn man die Bedeutung eines Begriffs durch Angabe seiner Merkmale, 
seiner Bestandteile oder seines „Wesens“ bestimmt (Opp, 1976, S. 201-202; 
Regenbogen & Meyer, 1998, S. 135). Dies ist jedoch irrefuhrend, da es sich um keine 
Gleichsetzung von Definiens und Definiendum handelt, sondern um eine Explikation. 
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0 Der alltagliche Begriff der „Intelligenz 44 kann durch die Unterscheidung verschiedener 
Intelligenzfaktoren oder durch die in einem bestimmten Intelligenztest zu losenden 
Aufgaben expliziert werden, aber auch durch die Angabe der zugrunde liegenden 
kognitiven Strukturen und Prozesse. 259 

0 Die Leistungsmotivation wird in der Psychologie als die „Auseinandersetzung mit einem 

TuchtigkeitsmaBstab 44 expliziert, vor allem aber dadurch, dass zwei Teilkomponenten 

260 

unterschieden werden: „Hoffnung auf Erfolg 44 und „Furcht vor Misserfolg 44 . 

In wissenschaftsphilosophischen und methodologischen Texten, also auch in dem 
gegenwartig vorliegenden, nehmen Explikationen einen besonders groBen Raum ein, 
denn ihr Hauptziel besteht meist darin, fiir bereits vorhandene und benutzte 
Konzepte verbesserte (d.h. konsistentere, tiefergehende, fundiertere oder prazisere) 
Erlauterungen oder Umschreibungen vorzustellen. 

0 Die in der Aussagenlogik definierte implikative Verknupfung — > von zwei Aussagen 
(siehe Tabelle 3.2) kann als Explikat des Begriffs „folgt aus 44 der alltaglichen und 
wissenschaftlichen Umgangssprache betrachtet werden. 

0 Der Begriff der wissenschaftlichen Theorie wird in der strukturalistischen Wissen- 
schaftstheorie als Netz von Theorie-Elementen expliziert, die jeweils aus verschiedenen 
Mengen von Modellen und Anwendungen bestehen (siehe Kapitel 11.2). 

Jede Explikation kann unterschiedlich sinnvoll oder adaquat sein. Generell ist eine 

• • 

Explikation umso adaquater, je groBer die Ahnlichkeit zwischen Explikat und 
Explikandum ist, je exakter das Explikat ist und je fruchtbarer das Explikat fiir die 
jeweils verfolgten Ziele ist. Daraus ergibt sich, dass das gleiche Explikat je nach 
vorliegender Situation und Problemstellung unterschiedlich adaquat sein kann. 

Wie die obigen Beispiele zeigen, sind Explikationen keine rein begrifflichen 
Operationen. Sie erfolgen vielmehr haufig dadurch, dass auf eine fachwissen- 
schaftliche Theorie zuruckgegriffen wird. Damit ist die Adaquatheit einer 
Explikation allerdings auch von der Giiltigkeit dieser Theorie abhangig. AuBerdem 
wird deutlich, dass fiir fast jeden interessierenden Begriff verschiedene 
Explikationen denkbar und sinnvoll sind. 



5.5 Paradigmatische Falle 

Explizit definieren lasst sich die Bedeutung eines Begriffes, indem der nachsthohere 
Oberbegriff (genus proximum ) und die spezifischen Unterschiede (differentia 
specific a) angegeben werden. Durch eine derartige Nominaldefinition wird eine 
Menge von Merkmalen spezifiziert, die einzeln notwendig und zusammen 
hinreichend fiir die Einordnung eines Objektes in die entsprechende Kategorie sind 
(siehe Kapitel 5.2). 



Jager (1984), Schweizer (1997), Funke & Vaterrodt-Plunnecke (1998) 
Heckhausen (1989, S. 231-238) 
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Dieses klassische Idealmodell fur eine Begriffsdefinition lasst sich allerdings fiir 
wichtige Begriffe in Wissenschaft und Alltag nicht oder nur sehr unvollkommen 
anwenden. Haufig bezeichnen wir verschiedene Objekte ohne zu zogern und ohne in 
Schwierigkeiten zu geraten mit einem Begriff, obwohl diese Objekte bei naherer 
Betrachtung iiberhaupt keine einzeln notwendigen und zusammen hinreichenden 

r\ r 1 

Merkmale gemeinsam haben. 

Diese grundsatzliche Schwierigkeit bei der Definition von Begriffen hat Ludwig 
Wittgenstein am Beispiel des Begriffs „Spiel“ illustriert . 262 

0 Zu den Spielen gezahlt werden FuBballspiele der Bundesliga, Schachspiele am Kamin, 
Indianerspiele von Kindern usw. Gemeinhin wird vermutet, dass alle diese Vorgange 
etwas gemeinsam haben miissten, weil sie sonst nicht unter denselben Begriff eingeordnet 
werden wiirden. Diese Gemeinsamkeiten wtirden dann das „Wesen des Spiels“ 
ausmachen. Nach Wittgenstein lassen sich derartige Gemeinsamkeiten aber nicht finden. 
Es gibt lediglich eine Reihe von Ahnlichkeiten und Verwandtschaften zwischen den 
verschiedenen Spielen. Einige Spiele sind in bestimmten Merkmalen ahnlich (z.B. FuB- 

und Handball), andere haben andere Ahnlichkeiten (z.B. Schach und Muhle). 

• • 

Einige Ahnlichkeitsbeziehungen zwischen den Elementen einer Klasse von Objekten 
laufen parallel, andere divergieren. Dieses Geflecht wird als F amilienahnlichkeit 
bezeichnet, weil auch die Mitglieder einer groBen Familie in unterschiedlichem 
AusmaB und in unterschiedlicher Hinsicht zueinander ahnlich sind, ohne stets eine 
bestimmte Menge gemeinsamer Merkmale zu besitzen. Derartige Familien- 
ahnlichkeiten finden sich nicht nur bei relativ konkreten alltaglichen Begriffen, 
sondern auch bei abstrakteren Konzepten wie „Zahl“ oder „Beweis“. 

Unterstlitzung findet diese Position durch spater durchgefiihrte psychologische 
Forschungen zur Kategorisierung von Objekten. 

0 Nach den Ergebnissen zahlreicher Experimente sind die Abgrenzungen von alltaglichen 
Kategorien (z.B. Vogel, Krankheit, Tasse) kontinuierlich und variabel. Die Wahr- 
scheinlichkeit beispielsweise, mit der ein GefaB als Tasse oder als Schussel bezeichnet 
wird, verandert sich allmahlich mit der Form und ist deutlich situationsabhangig. 

Zur Spezifikation der Bedeutung von Begriffen ohne bestimmte Gemeinsamkeiten 
hat Wittgenstein die Methode der paradigmatischen Beispiele beschrieben: 

Erstens wird eine Menge von paradigmatischen Beispielen definiert, d.h. eine 
Menge von Objekten, die ohne Zweifel unter den zu definierenden Begriff fallen. 
Diese paradigmatische Beispielmenge wird extensional durch Aufzahlung der 
zugehorigen Objekte definiert. In der psychologischen Kategorisierungsforschung 



26 1 

Es gibt immer allgemeine Attribute, die alien Objekten gemeinsam sind, die unter einen 
Begriff fallen (z.B. sind alle Psychologen Lebewesen). Sie sind aber zusammen nicht 
hinreichend fiir die Einordnung eines Objektes in die betreffende Kategorie. 

262 Wittgenstein (1953), Stegmtiller (1969, S. 611-613; 1985, S. 195-197) 

263 Rosch (1978), Giere (1994), Anderson (1996a, S. 153-156) 
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entsprechen die paradigmatischen Objekte den Objekten, die typisch fur die 

r\ s' A 

betrachtete Kategorie sind und auch als Prototypen bezeichnet werden. 

Zweitens wird festgelegt, dass ein anderes Objekt dann mit in die durch den zu 

definierenden Begriff bezeichnete Kategorie eingeordnet wird, wenn es eine aus- 

• • 

reichend hohe Ahnlichkeit zu einem, zu mehreren oder gar zu alien paradigmatischen 

Objekten hat. 265 

• • 

Da diese Ahnlichkeiten natlirlich nicht eindeutig festliegen, ist die Bedeutungs- 
spezifikation durch die Methode der paradigmatischen Beispiele unweigerlich mit 
einer erheblichen Vagheit behaftet. Sie hat aber fur die Wissenschaftsphilosophie 
eine sehr groBe Bedeutung erlangt. Dies liegt nicht nur daran, dass sie unserer 
alltaglichen Art der Bedeutungsspezifikation entspricht. Vielmehr spielen paradig- 
matische Beispiele auch bei der Anwendung von wissenschaftlichen Theorien eine 
entscheidende Rolle. Dies wurde zuerst von Thomas Kuhn beschrieben (siehe 
Kapitel 9.3 und 10.3) und spater innerhalb der strukturalistischen Wissenschafts- 
theorie systematisch beriicksichtigt (siehe Kapitel 11.8). 



In Untersuchungen wird diese „Typikalitat“ direkt eingeschatzt. So wird FuBball als 
sehr typische Sportart eingeschatzt, Gewichtheben nicht (Anderson, 1996a, S. 153). 

265 Ahnlichkeiten zwischen Objekten konnen durch direkte Einschatzungen erfaBt werden. 
In den einschlagigen psychologischen Untersuchungen wird die Ahnlichkeit der Objekte 
in einer Kategorie oder Familie aber meist mit der Anzahl der Merkmale gleichgesetzt, 
die sie nach Angaben der Personen gemeinsam haben (z.B. bei Rosch & Mervis, 1975). 
Vernachlassigt wird dabei allerdings, dass die Ahnlichkeit auch von Merkmalen 
bestimmt wird, in denen sich die Objekte unterscheiden (Tversky, 1977; Westermann, 
Hesse, Hiemisch & Kauer, 1996). 





6 Charakterisierungen durch Mengen und Strukturen 



Im Kapitel 5 wurde dargestellt, wie die Bedeutung wissenschaftlicher Begriffe durch 
explizite Definition, Angabe von paradigmatischen Fallen oder theoretische 
Explikation spezifiziert werden kann. Wir haben gesehen, dass die Bedeutung vieler 
psychologischer Begriffe relativ offen und vage bleibt. Diese definitorische 
Unbestimmtheit hat zwar auch Vorteile, kann aber leicht zu Unklarheiten, 
Missverstandnissen und Verwirrungen ftihren. Diese Nachteile konnen jedoch 
weitgehend ausgeglichen werden: durch eine explizite und prazise Charakterisierung 
der wissenschaftlichen Begriffe, die Teil jeder strukturalistischen Rekonstruktion 
einer wissenschaftlichen Theorie ist. Dabei geben wir erstens die Art des Begriffs an, 
das heiBt, ob er z.B. ein Objekt, eine Menge oder eine Relation bezeichnet. Zweitens 
spezifizieren wir, in welcher Beziehung er zu anderen Begriffen steht. 

Fur diese Charakterisierung von wissenschaftlichen Begriffen verwenden wir die 
mathematische Mengenlehre. Ihre wesentlichen Konzepte werden im folgenden 
eingefuhrt und illustriert: der Begriff der Menge selbst (Kapitel 6.1), die 
Verkniipfungen zwischen Mengen (Kapitel 6.2), die kartesischen Produkte (Kapitel 
6.3), die Relationen (Kapitel 6.4) und Strukturen (Kapitel 6.5) sowie schlieBlich die 
Abbildungen von Mengen (Kapitel 6.6) und Strukturen (Kapitel 6.7). 



6.1 Mengen 

• Eine Menge ist eine Zusammenfassung von bestimmten, eindeutig zu 
unterscheidenden Objekten unserer Anschauung oder unseres Denkens zu einem 
Ganzen. Die Objekte heiBen die Elemente der Menge. 



266 

psychologisch orientierte Einfuhrungen: Coombs, Dawes & Tversky (1975, Anhang 
A2), Steyer & Eid (1993, S. 307-326); mathematische Darstellungen: Dallmann & 
Elster (1991, S. 64-75), Reinhardt & Soeder (1978, S. 23-51), Suppes (1960) 
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Viele Begriffe im Alltag und in der Wissenschaft bezeichnen Zusammenfassungen 
von bestimmten zusammengehorenden oder ahnlichen Dingen zu Mengen. Sie 
werden auch als Klassen oder Kategorien bezeichnet. 

0 Der Begriff „Bundeslander“ bezeichnet die Kategorie oder Klasse von Objekten, auf die 
das Pradikat ist ein Bundesland“ zutrifft. 

0 Die psychologische Beschreibung von Personen durch Zuordnung von Adjektiven wie 
„aggressiv-gespannt“ oder „hochintelligent“ entspricht jeweils der Zusammenfassung der 
entsprechend beschriebenen Personen in einer Menge oder Kategorie. 

Zur Bezeichnung von Mengen werden meist GroBbuchstaben verwendet. Zur 
Bezeichnung von Elementen dienen Kleinbuchstaben. Werden die Elemente einer 
Menge aufgezahlt, setzt man sie in geschweifte Klammern. Besteht die Menge P aus 
den Elementen a, b und c, wird dies P = {a, b, c} geschrieben. Der Ausdruck „a e P“ 
bedeutet „a ist Element von P“, „d t. P“ heiBt „d ist nicht Element von P“. 

Die Einordnung eines Objektes a in eine Menge P ist Equivalent mit der 
Zuschreibung eines einstelligen Pradikats P zu diesem Objekt a, die wir im Kapitel 
3.3 als P(a) bezeichnet haben. 

Zwei Mengen heiBen gleich, wenn sie dieselben Elemente enthalten. Die 
Reihenfolge der Elemente ist dabei nicht von Bedeutung. Beispielsweise sind die 
Mengen A = {a, b, c} und B = {b, a, c} gleich. Eine ganz besondere Menge ist die 
Menge ohne Elemente. Sie wird die leere Menge genannt und durch das Symbol • 
bezeichnet. Die Beschreibung oder Definition von Mengen kann unterschiedlich 
erfolgen: 

• Erstens haben sich feste Symbole fur die Bezeichnung bestimmter Mengen 
eingeburgert. So werden wir N, P und P 0+ als Zeichen fur die Mengen der 
natiirlichen, der reellen und der nicht-negativen reellen Zahlen benutzen. 268 

0 In der Psychologischen Diagnostik sind Begriffe wie „FPI-Skalen“ oder „HAWIE- 
Untertests“ allgemein verstandliche Bezeichnungen fiir eindeutig festliegende Mengen 
von Bestandteilen bekannter Testverfahren. 

• Zweitens kann jede Menge mit endlich vielen Elementen extensional definiert 
werden, d.h. indem alle ihre Elemente aufgezahlt werden. 

0 Durch B := {Extra version, Neurotizismus, Offenheit, Vertraglichkeit, Gewissen- 
haftigkeit} ist die Menge der Personlichkeitsfaktoren des Funf-Faktoren-Modells 
(„Big Five“) definiert. 269 

26V 

In der Mathematik werden z.B. die Konzepte des Zahlensy stems, der Algebra, der 
Geometrie und der Wahrscheinlichkeitstheorie auf dem Begriff der Menge aufgebaut 
(Reinhardt & Soeder, 1978). Auch Begriffe wie Funktion, Struktur und Abbildung, die 
in psychologischen Texten haufig auftreten, bezeichnen bestimmte Arten von Mengen. 
268 Natlirliche Zahlen sind 0, 1,2, usw. Zu den rationalen Zahlen gehoren darliber hinaus 
alle negativen ganzen Zahlen -1, -2, usw. sowie alle moglichen Zahlen zwischen zwei 
ganzen Zahlen, d.h. z.B. 15,3 und -6,47853. Zu den reellen Zahlen gehoren zusatzlich 
auch alle Zahlen, die sich nicht durch endliche viele Dezimalstellen ausdrlicken lassen 
(beispielsweise 71 = 3,14159.... und e = 2,71828...). 
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• Drittens kann jede Menge durch Angabe bestimmter Bedingungen intensional 
definiert werden. In der Mathematik ist dazu eine bestimmte Schreibweise 
gebrauchlich, bei der die geforderten Eigenschaften durch das Bedingungszeichen 
I angezeigt werden . 270 

0 Die Menge W(r) der moglichen Werte des Korrelationskoeffizienten r kann 
folgendermaBen definiert werden: W(r) := { x I x • P a -1 < x < +1 }. Sie umfasst 
danach alle Objekte, die Elemente der Menge der reellen Zahlen, nicht kleiner als -1 
und nicht groBer als +1 sind. 

0 Sehr viele psychologische Fachbegriffe entsprechen Mengen, die nur intensional 
definiert werden konnen. Der Begriff „Sozialphobiker“ beispielsweise bezeichnet die 

271 

Menge aller Personen, die nach bestimmten Kriterien eine soziale Phobie haben. 

Die Grundbegriffe wissenschaftlicher Theorien, d.h. diejenigen Begriffe, die 
innerhalb einer Theorie nicht weiter definiert werden, bezeichnen immer Mengen . 272 

0 In der Theorie der kognitiven Dissonanz tritt als Grundbegriff eine Menge von 
Kognitionselementen auf. 

0 In der Kognitionsarchitektur ACT* tritt als nicht weiter analysierter Grundbegriff eine 
Menge von Kognitionseinheiten auf. 

0 In der Rubikontheorie der Handlungsphasen gibt es als Grundbegriffe eine Menge von 
Aktivitaten (die offen oder verdeckt sein konnen) und eine Menge der Ziele (die bewusst 
oder unbewusst sein konnen). 

Untermenge 

• B ist eine Teil- oder Untermenge von A (symbolisiert als B c A) genau dann, 

977 

wenn alle Elemente der Menge B auch Elemente der Menge A sind. 

• B ist dabei eine echte Untermenge von A (symbolisiert als BcA) genau dann, 
wenn es auch Elemente von A gibt, die nicht Elemente von B sind. 

0 Ist S die Menge der Sozialphobiker und P die Menge der Phobiker, gilt ScP, denn zur 
Menge der Phobiker gehoren auch die Personen mit Platzangst, mit Hohenangst usw. 

0 Da die Dissonanztheorie wie die meisten anderen psychologischen Theorien 
Veranderungen liber die Zeit beschreiben und erklaren soil, gehort zu ihren 
Grundbegriffen eine Menge von betrachteten Zeitpunkten. Diese Menge kann als 
Untermenge der Menge der reellen Zahlen charakterisiert werden: Zeitpunkte <z P . 



Borkenau & Ostendorf (1991), Zimbardo (1995, S. 480) 

270 i 

Statt des Bedingungszeichens I wird haufig auch ein Doppelpunkt verwendet. 

271 DSM-IV (1996), vgl. oben Seite 103 

272 

Hier und im Folgenden wird auf strukturalistische Rekonstruktionen der Dissonanz- 
theorie von Festinger (1978), der ACT*-Theorie von Anderson (1983) und der 
Rubikontheorie von Heckhausen (1989) und Gollwitzer (1991, 1996) zurtickgegriffen, 
die von Westermann (1987a), Heise (1991) und Gerjets (1995) stammen (siehe unten 
Kapitel 11). 

273 

Die prazise explizite Definition lautet BcA :<-> Vx: xg B-^xg A. 
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0 Nach der Kognitionstheorie ACT* gibt es eine Menge von kognitiven Einheiten, die das 
sog. deklarative Gedachtnis bilden. Das Langzeitgedachtnis und das Arbeitsgedachtnis 
sind Untermengen des deklarativen Gedachtnisses: Arbeitsgedachtnis c Deklaratives 
Gedachtnis und Langzeitgedachtnis c Deklaratives Gedachtnis. 

Untermengen- und Elementbeziehung diirfen nicht verwechselt werden. Haben wir 

eine Menge {1,2,3} von natiirlichen Zahlen, ist 2 ein Element dieser Menge: 2 e 

{1,2,3}. Das Element 2 ist aber keine Untermenge dieser Menge. Hingegen ist {2}, 

d.h. die Menge, die als Element 2 hat, eine Untermenge: {2} c { 1,2,3}. 

Potenzmenge 

• Die Potenzmenge Po(A) einer Menge A ist die Menge aller ihrer Teilmengen. 

Die Potenzmenge ist also eine Menge, die als Elemente wiederum Mengen enthalt. 274 

0 Ist A = {Antje, Bjorn, Claudia} eine Menge von drei Studierenden, umfasst ihre Potenz- 
menge drei Mengen mit jeweils einer Person, drei Kombinationen von zwei Personen 
sowie die gesamte und die leere Menge: Po(A) = { {Antje}, {Bjorn}, {Claudia}, {Antje, 
Bjorn}, {Antje, Claudia}, {Bjorn, Claudia}, {Antje, Bjorn, Claudia}, { • } }. 

Zentrale Begriffe psychologischer Theorien sind als Potenzmengen von 

Grundmengen zu charakterisieren. 

0 Die Dissonanztheorie bezieht sich auf die Kognitionen einer Person. Diese konnen aus 
mehreren elementaren Kognitionen zusammengesetzt sein. Der Begriff der Kognitionen 
bezeichnet also die Potenzmenge einer Grundmenge von Kognitionselementen. 

0 In der ACT*-Theorie tritt als Grundbegriff eine Menge elementarer Kognitionseinheiten 
auf. Ihre Potenzmenge umfasst alle moglichen zusammengesetzten Kognitionen, auf die 
die Theorie sich beziehen kann. 



6.2 Verkntipfungsoperationen 

In der Mengenlehre sind verschiedene Verkniipfungen von Mengen gebrauchlich, 
die sehr eng mit den logischen Junktoren zur Verkniipfung von Aussagen (siehe 
Kapitel 3.2.2) verwandt sind. Veranschaulicht werden diese Verkniipfungen durch 
sog. Euler- oder Venn-Diagramme (Abbildung 6.1), in denen zwei Mengen A und B 
jeweils durch einen Kreis dargestellt sind. Die Elemente von A und B konnen wir 
uns als Punkte innerhalb des jeweiligen Kreises vorstellen. Die GroBe der Kreise und 
die GroBe ihres Uberschneidungsbereiches haben in Venn-Diagrammen keine 
inhaltliche Bedeutung und konnen deshalb nach Belieben gewahlt werden. 



274 I 

Po(A) := {B IB c A }. Nach der Definition von Po(A) ist auch A selbst Element von 
Po(A). Da die leere Menge 0 per definitionem Teilmenge jeder anderen Menge ist, ist 
sie auch Teilmenge von Po(A). Hat A n Elemente, enthalt Po(A) 2 n Elemente. 
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Differenz 

975 

• Die Menge A\B enthalt die Elemente von A, die nicht in B sind. 

Die Menge BYA ist dementsprechend die Menge der Elemente von B, die nicht auch 
zu A gehoren. Ist B c A, so stellt die Differenz AYB das Komplement von B 
beziiglich A dar. 

0 Ist A die Menge der Diplom-Psychologen und B die Menge der Psychotherapeuten, stellt 
B\A die Menge der Psychotherapeuten dar, die keine Diplom-Psychologen sind (sondern 
z.B. Psychiater). 




Abbildung 6.1: Venn-Diagramm zur Verkntipfung von Mengen 

Durchschnitt 

• Die Menge A n B enthalt die Objekte, die Elemente von A und von B sind. 

• • 

In der Abbildung entspricht der Durchschnitt dem Uberschneidungsbereich der 

Kreise. Wenn die beiden Mengen keine gemeinsamen Elemente haben, d.h. wenn A 

n B = • , heiBen A und B disjunkt. 

0 Nach der Dissonanztheorie sind zwei Kognitionen entweder dissonant, konsonant oder 
irrelevant zueinander. Die Mengen der Dissonanten Kognitionen und der Konsonanten 
Kognitionen konnen also keine Elemente gemeinsam haben, sie sind disjunkt. 

0 Bei den schweren Essstorungen werden zwei spezielle Diagnosen unterschieden. 277 Bei 
der Anorexia Nervosa halt die Person ein Korpergewicht aufrecht, das unter dem 
Minimum des normalen Gewichts liegt. Die Bulimia Nervosa ist durch wiederholte 
„Fressattacken“ und ,,AbfuhrmaBnahmen“ gekennzeichnet, die betroffenen Personen 
halten ihr Korpergewicht aber um oder liber dem Minimum. Beide Diagnosen schlieBen 
sich aus, die Mengen der anorektischen und der bulimischen Personen sind also disjunkt. 

Vereinigung 

97R 

• Die Menge AuB enthalt die Objekte, die Elemente von A oder von B sind. 

AYB :={x IxgAax^B} 

AnB:={x IxeAaxeB} 

DSM-IV (1996, S. 613-625) 

AuB:={x IxeAvxeB} 



275 

276 

277 

278 
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Wie an der Abbildung 6.1 deutlich wird, ist die Vereinigung von A und B gleich dem 

97Q 

Durchschnitt plus den beiden Differenzmengen. 

0 Nach ACT* ist das deklarative Gedachtnis eine Menge von kognitiven Einheiten, die aus 
den kognitiven Einheiten des Langzeitgedachtnisses und des Arbeitsgedachtnisses 
besteht: Arbeits gedachtnis u Langzeitgedachtnis = Deklaratives Gedachtnis. 



6.3 Kartesische Produkte 

Fur die Analyse der wissenschaftlichen Begriffsbildung grundlegend sind die 
kartesischen Produkte zwischen Mengen. Sie konnen zwischen zwei oder mehr 
Mengen gebildet werden. Ein kartesisches Produkt ist die Menge aller moglichen 
Kombinationen der Elemente der urspriinglichen Mengen. Der einfachste Fall ist das 
kartesische Produkt zweier Mengen M! und M 2 . 

• Das kartesische Produkt M t x M 2 ist die Menge aller moglichen geordneten Paare 

980 

aus einem Element der Menge und einem Element der Menge M 2 . 

0 P = {Antje, Bjorn, Claudia, Dieter, Erik} ist die Menge der Mitglieder einer Selbsthilfe- 
gruppe und A = {Panikstorang, Sozialangst, Platzangst, Objektangst} ist eine Menge von 
moglichen Angststorungen. Das kartesische Produkt P x A besteht aus 5 x 4 = 20 
Elementen. Jedes von ihnen ist ein geordnetes Paar, dessen erstes Element aus der Menge 
der Personen und dessen zweites Element aus der Menge der Storungen stammt. 

Im Einzelnen ausgeschrieben ist P x A = {(Antje, Panikstorang), (Antje, Sozialangst), 
(Antje, Platzangst), (Antje, Objektangst), (Bjorn, Panikstorang), (Bjorn, Sozialangst), 
(Bjorn, Platzangst), (Bjorn, Objektangst), (Claudia, Panikstorang), (Claudia, Sozialangst), 
(Claudia, Platzangst), (Claudia, Objektangst), (Dieter, Panikstorang), (Dieter, 
Sozialangst), (Dieter, Platzangst), (Dieter, Objektangst), (Erik, Panikstorang), (Erik, 
Sozialangst), (Erik, Platzangst), (Erik, Objektangst)}. 

Ein kartesisches Produkt kann auch fiir eine einzige Menge gebildet werden. M x M 

989 

enthalt alle moglichen Kombinationen zwischen den Elementen der Menge M. 

0 P x P hat 5 x 5 = 25 Elemente: {(Antje, Antje), (Antje, Bjorn), (Antje, Claudia), (Antje, 
Dieter), (Antje, Erik), (Bjorn, Antje), (Bjorn, Bjorn), ..., (Erik, Erik)}. 



AuB = {AnB}u A\B u B\A 

280 Ml X M 2 = {(xi, X 2 ) Ixi G Ml A X 2 G M 2 } 

281 Eine Panikstorang ist durch wiederholte, plotzliche und starke Angstzustande mit 
korperlichen Beeintrachtigungen (Panikattacken) gekennzeichnet. AuBerdem haben wir 
in diesem Beispiel ubermaBige und anhaltende Angste vor sozialen oder 
Leistungssituationen (Sozialphobie), vor Platzen oder Situationen, in denen eine Flucht 
schwer moglich ist (Agoraphobie) und vor bestimmten Klassen von Objekten oder 
Situationen wie Schlangen oder Spritzen (DSM-IV, 1996, S. 453-480). 

282 

M x M wird auch als M 2 bezeichnet. M n ist dementsprechend das n-fache kartesische 
Produkt der Menge M mit sich selbst. 
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Bei kartesischen Produkten kommt es wesentlich auf die Reihenfolge an. M! x M 2 
und M 2 x Mi sind nicht identisch, auBer wenn Mi = M 2 ist. Man bezeichnet die 
Elemente eines kartesischen Produktes deshalb als geordnete Paare und schreibt sie 
meist in spitzen Klammern. Mengen hingegen, bei denen die Reihenfolge der 
Elemente keine Rolle spielt, werden mit geschweiften Klammern bezeichnet. 

0 Die geordneten Paare (Antje, Panikstorung) und (Panikstorung, Antje) sind verschieden. 
Das erste ist Element von P x A, das zweite ist nicht Element von P x A, wohl aber von A 
x P. Die Mengen {Antje, Panikstorung} und {Panikstorung, Antje} dagegen sind gleich, 
weil sie die gleichen Elemente enthalten. 

Bei drei Mengen haben die Elemente eines kartesischen Produktes die Form (xi, x 2 , 
x 3 ). Derartige Anordnungen von drei Komponenten bezeichnet man als Tripel. 

0 Haben wir neben den oben eingefuhrten Mengen P und A eine Menge S = { leicht, mittel- 
schwer, schwer, remittiert} von Schweregraden, hat das kartesische Produkt zwischen 
den drei Mengen 80 Elemente: P x A x S = {(Antje, Panikstorung, leicht), (Antje, 
Panikstorung, mittelschwer), ..., (Eric, Objektangst, remittiert)}. 284 



6.4 Relationen 

Die wichtigsten wissenschaftlichen Begriffe sind Relationen. Sie bezeichnen 
Beziehungen zwischen den Elementen einer Menge oder den Elementen verschie- 
dener Mengen. Konkret kann es sich um Beziehungen zwischen verschiedenen 
Personen, Objekten, Ereignissen, Ideen, Phanomenen usw. handeln. 

0 Nach der Dissonanztheorie werden zwei Kognitionen als dissonant bezeichnet, wenn fur 

285 

die betreffende Person aus der einen Kognition das Gegenteil der anderen folgt. 
Sowohl im umgangssprachlichen wie im mengentheoretischen Sinn stellt die Dissonanz 
eine Relation zwischen jeweils zwei Kognitionen dar. 

In der Mathematik ist eine Relation nichts anderes als eine bestimmte Untermenge 
eines bestimmten kartesischen Produktes: 

• Jede Untermenge R c Mi x ... x M n ist eine Relation auf den Mengen Mi bis M n . 

Die Anzahl der am kartesischen Produkt beteiligten Mengen definiert die Stelligkeit 
der Relation: Eine Untermenge von M t x M 2 x M 3 beispielsweise ist eine dreistellige 
Relation. Allgemein heiBt eine Relation, die auf n Mengen definiert ist, n-stellig. 

0 Die Dissonanz zwischen Kognitionen entspricht einer zweistelligen Relation Disskog, die 
auf dem kartesischen Produkt der Menge der Kognitionen mit sich selbst definiert ist: 
Disskog c Kognitionen x Kognitionen. 

283 

Bei vier und ftinf Komponenten spricht man von Quadrupel bzw. Quintupel, allgemein 
von n-Tupeln. Allgemein gilt die Definition x ... x M n := {(x 1? ..., x n ) I X} e Mj}. 

284 DSM-IV (1996, S. 5), „Remittiert“ ist dabei eine Stoning, die zuriickgebildet ist. 

285 Festinger (1978, S. 25-26) 
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Will man ausdrlicken, dass ein Tupel (x,, x n ) Element einer Relation R ist, kann 
man statt (x 1? x n ) e R auch R(xi, x n ) schreiben. Bei zweistelligen Relationen 
schreibt man entweder R(x,y) oder xRy, um auszudriicken, dass x und y in der 
Relation R stehen. 

Welche Elemente des kartesischen Produktes konkret auch Elemente einer 

bestimmten Relation sind, muss sachgerecht bestimmt werden. Je nach Fragestellung 

erfolgt diese Bestimmung auf Grund von empirischen Beobachtungen und 

• • 

Untersuchungen, auf Grund theoretischer Uberlegungen oder per Definition. 

0 Bei der Anwendung der Dissonanztheorie geht man meist ohne besondere Prtifung davon 
aus, dass bestimmte Kognitionen bei alien Personen dissonant sind, beispielsweise „Ich 
finde das Experiment langweilig“ und „Ich habe anderen Studenten das Experiment als 
sehr interessant empfohlen“. 

Veranschaulichungen 

Zweistellige Relationen lassen sich einfach tabellarisch und graphisch darstellen. 

0 Haben wir die obigen Mengen P und A und befragen die fiinf Personen nach ihren 
gegenwartigen Angstsymptomen, ist das Ergebnis dieser empirischen Untersuchung eine 
Untermenge von P x A, beispielsweise Ri = {(Antje, Sozialangst), (Antje, Panikstorang), 
(Bjorn, Panikstorang), (Bjorn, Platzangst), (Bjorn, Objektangst), (Dieter, Objektangst), 
(Erik, Panikstorang), (Erik, Objektangst)}. Die Relation Ri steht dann fur acht Aussagen 
der Form „Person x hat Symptom y“. Die Elemente dieser Relation sind in der Tabelle 
6.1 durch eine Eins veranschaulicht. Eine Person (Claudia) steht zu keiner der vier 
Symptome in der Relation Ri, weil sie andere oder gar keine Symptome hat. Dieter hat 
nur eine spezifische Phobie vor einer bestimmten Klasse von Objekten, die anderen drei 
haben Panikstorungen, verbunden mit Sozial-, Platz- oder Objektangst. 



Tabelle 6.1: Veranschaulichung von zweistelligen Relationen und R 2 





Antje 


Bjorn 


Claudia 


Dieter 


Erik 


Panikstorang 


1 2 


1 


2 




1 


Sozialangst 


1 




2 






Platzangst 




1 








Objektangst 




1 2 




1 


1 2 



0 Fragen wir die Eltern dieser Personen, welche Symptome sie im Alter von etwa 15 Jahren 
gezeigt haben, erhalten wir als Ergebnis in der Regel eine andere Relation, beispielsweise 
R 2 = {(Antje, Panikstorang), (Bjorn, Objektangst), (Claudia, Panik-storung), (Claudia, 
Sozialangst), (Erik, Objektangst)}. Die Elemente dieser Relation sind in der Tabelle 
durch eine Zwei veranschaulicht. Eine Person (Dieter) und eine Angststorung 
(Platzangst) sind an dieser Relation R 2 nicht beteiligt. 
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Als Beispiel flir die graphische Darstellung einer Relation ist in der Abbildung 6.2 
die Relation dargestellt. 




Abbildung 6.2 : Graphische Darstellung einer zweistelligen Relation 

Auftreten in der Psychologie 

Etliche wichtige Begriffe psychologischer Theorien sind als zweistellige Relationen 
zu charakterisieren. 

0 Zum deklarativen Gedachtnis einer Person gehoren zu verschiedenen Zeitpunkten 
unterschiedliche kognitive Einheiten. Zum festen Wissensbestand einer Psychologie- 
studentin, die sich gut auf die Statistik-Klausur vorbereitet hat, gehoren beispielsweise 
Begriffe wie „Median“ und ,,Konfidenzintervall“, die ihr ein paar Monate vorher noch 
vollig unbekannt waren. Es ist deshalb sinnvoll, das deklarative Gedachtnis als Unter- 
menge des kartesischen Produktes der Mengen der betrachteten kognitiven Einheiten und 
Zeitpunkte zu charakterisieren: Deklaratives Gedachtnis cz Kognitions einheiten x Zeit. 

Diagnosen von Personen entsprechen mindestens zweistelligen Relationen. Werden 
sie mit erganzenden Angaben zum Beispiel zur Schwere der Storung oder ihrer 
Entstehung versehen sind, entsprechen sie drei- oder mehrstelligen Relationen. 

0 Das kartesische Produkt unserer oben eingefuhrten Beispielmengen P, A und S umfasst 
alle moglichen Kombinationen der ftinf Personen, vier Angststorungen und vier 
Schweregrade. Diagnostizieren wir in einer Untersuchung nicht nur die Angststorungen 
bei diesen Personen, sondern auch die Schweregrade, ist das Ergebnis eine Untermenge 
R 3 von P x U x S, also beispielsweise R 3 = {(Antje, Sozialangst, mittelschwer), (Antje, 
Panikstorung, leicht), (Bjorn, Panikstorung, schwer), (Bjorn, Platzangst, schwer), (Bjorn, 
Objektangst, remittiert), (Dieter, Objektangst, mittelschwer), (Erik, Panikstorung, 
mittelschwer), (Erik, Objektangst, schwer)}. 

Auch in psychologischen Theorien gibt es etliche Begriffe, die Relationen in Bezug 
auf drei oder mehr Mengen entsprechen. 

0 In der Rubikontheorie wird eine Handlung als eine Sequenz von Aktivitaten definiert, die 
auf ein Ziel gerichtet sind. Daher werden als Grundbegriffe Mengen von Aktivitaten, 
Zeiten und Zielen eingeftihrt. Der Begriff der zielgerichteten Aktivitaten wird dann als 
Untermenge des kartesischen Produktes dieser drei Mengen charakterisiert: 
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Zielaktivitaten c Ziele x Aktivitaten x Zeiten. Ein Tripel aus einem Ziel, einer Aktivitat 
und einem Zeitpunkt ist genau dann Element dieser Relation, wenn die betreffende 
Aktivitat zu der gegebenen Zeit fur die Erreichung des betrachteten Ziels niitzlich ist. 



6.5 Strukturen 

Im Alltag und in der wissenschaftlichen Umgangssprache verwenden wir den Begriff 
der Struktur oder der Strukturierung meist, um auszudrticken, dass verschiedene 
Dinge sinnvoll angeordnet oder aufeinander abgestimmt sind: Der Student struktu- 
riert seinen Tagesablauf, um moglichst viel Arbeitszeit fur die Priifungsvorbereitung 
zu haben; der Manager strukturiert den Betrieb neu, um kostengtinstiger zu produ- 
zieren; der Politiker versucht seine Argumente in eine Struktur zu bringen, damit die 
Zuhorer ihnen folgen konnen usw. 

0 In den sog. kognitiven Verhaltenstherapien werden Depressionen und andere psychische 

Storungen durch „kognitive Umstrukturierungen“ behandelt, das heiBt dadurch, dass man 

286 

die zugrunde liegenden Gedanken, Urteile und Wahmehmungen verandert. 

In der mathematischen Mengenlehre ist der Begriff der Struktur prazise definiert. 
Um sie von Mengen zu unterscheiden, werden Strukturen haufig mit geschwungenen 
BuchstabenA, B, C, ... bezeichnet. 

• Eine Struktur ist ein Tupel (M b ..., M n , R l5 ..., R k ), bestehend aus 

- einer Anzahl von Mengen Mi bis M n und 

- einer Anzahl von Relationen R t bis R k auf alien oder einigen dieser Mengen. 

Die Stelligkeit der Relationen bestimmt den Typ einer Struktur. Eine Struktur mit 
einer zwei- und einer vierstelligen Relation beispielsweise hat den Typ (2, 4). 

0 Die Beispielmengen P und A von Personen und Angststorungen und die beschriebenen 
gegenwartigen und vergangenen Symptomrelationen R | und R2 ergeben die Stmktur A = 
(P, A, Rj, R2) vom Typ (2,2). Nehmen wir den Schweregrad hinzu (Relation R3), erhalten 
wir die Stmktur B = (R, A, S, Ri, R2, R3). Sie ist vom Typ (2, 2, 3). 

Wie wir in nachfolgenden Kapiteln sehen werden, ist fur die psychologische 
Forschungsmethodik der mengentheoretische Begriff der Struktur auBerordentlich 
wichtig. Viele psychologische Begriffe entsprechen mengentheoretischen Strukturen, 
das Messen von objektiven oder subjektiven Merkmalen ist eine Abbildung von 
Strukturen, und wissenschaftliche Theorien konnen am besten als Strukturen 
beschrieben werden, die sich wiederum aus anderen Strukturen zusammensetzen. 

Psychologische Begriffe entsprechen sehr haufig Aquivalenz- oder Ordnungs- 
relationen und -strukturen. 



286 



Davison & Neale (1996, S. 654) 
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6.5.1 Aquivalenzstrukturen 

• • 

• Eine Aquivalenzrelation zerlegt eine Menge M in Untermengen, so dass jedes 
Element der Menge M zu genau einer Untermenge gehort. 

Die Untermengen sind dann „paarweise disjunkt“ (d.h. sie haben keine gemeinsamen 

Elemente) und „insgesamt erschopfend“ (d.h. sie ergeben zusammengefasst wieder 

• • 

die Menge M). Untermengen mit diesen Eigenschaften werden als Aquivalenz- 

• • 

klassen bezeichnet. Bezeichnet wird eine Aquivalenzrelation durch das Symbol ~. 

• • 

• Eine Aquivalenzrelation ist reflexiv, symmetrisch und transitiv. Das heiBt: 

- jedes Objekt ist Equivalent mit sich selbst ( Reflexivitat ), 

- wenn Objekt a Equivalent mit Objekt b ist, dann ist auch b Equivalent mit a 
(Symmetric), 

- wenn Objekt a Equivalent mit Objekt b ist und wenn b Equivalent mit c ist, 

dann ist auch a Equivalent mit c (Transitivitat). 

• • 

• Eine Objektmenge M zusammen mit einer Aquivalenzrelation d.h. das Paar 

(M,~), ist eine Aquivalenzstruktur. 

• • 

In der Psychologie entsteht eine Aquivalenzstruktur immer dann, wenn wir Personen 
oder andere Objekte nach bestimmten Merkmalen (z.B. Diagnose, Zahl der Kinder, 
Beruf) in disjunkte und erschopfende Untergruppen einteilen. 

0 Im Klassifikationssystem fur psychische Storangen DSM-IV „werden Subtypen ... und 
Zusatzkodierungen vorgegeben, um eine hohere Genauigkeit zu erreichen. Als Subtypen 
werden sich gegenseitig ausschlieBende und zusammengenommen erschopfende 
phanomenologische Untergruppen innerhalb einer Diagnose definiert ... Zum Beispiel 
wird die wahnhafte Stoning aufgrund des Inhalts der Wahnphanomene in Subtypen 
unterteilt, wobei 7 Subtypen vorgesehen sind: Typus mit Liebeswahn, Typus mit 
GroBenwahn, Typus mit Eifersuchtswahn, Typus mit Verfolgungswahn, Typus mit 
Korperbezogenem Wahn, Typus mit Gemischtem Wahn und Unspezifischer Typus. Im 
Gegensatz dazu mtissen Zusatzkodierungen sich nicht gegenseitig ausschlieBen und 
zusammengenommen erschopfend sein ...“. Eine Einordnung von Personen mit einer 
bestimmten Diagnose in Subtypen soil also zu einer Aquivalenzstruktur fuhren, eine 

Einteilung aufgrund von Zusatzkodierungen jedoch nicht. 

• • 

Wissenschaftliche Begriffe, die Aquivalenzklassen oder -strukturen entsprechen, 
werden als klassifikatorische Begriffe bezeichnet. 288 

0 Nach der Attributionstheorie konnen alle Ursachen und Grtinde, die Personen fur einen 
Misserfolg in einer Leistungssituation angeben, in vier Kategorien eingeteilt werden: 
internal-stabile Ursachen (z.B. mangelnde Fahigkeit), internal-variable Ursachen (z.B. 



287 

DSM-IV (1996, S. 4). Durch Zusatzkodierungen wird z.B. angegeben, ob die Storung 
generalisiert ist oder gunstige prognostische Merkmale hat. 

288 Hempel (1974), Kutschera (1972b) 
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mangelnde Anstrengung), external-stabile Ursachen (z.B. hohe Schwierigkeit) und 
external-variable Ursachen (z.B. zufallige Storungen). 289 Diese vier Ursachenkategorien 
sind Aquivalenzklassen. 

Axiomatische Definition 

• • 

Der Begriff einer Aquivalenzstruktur wird dadurch eindeutig definiert, dass man die 

Bedingungen angibt, die notwendig und hinreichend daftir sind, dass eine 

Aquivalenzstruktur vorliegt. 

• • 

(6-1) A ist eine Aquivalenzstruktur genau dann wenn 

(1) A = (M, R> 

(2) M*0 

(3) RcMxM 

(4) Vx € M: xRx 

(5) Vx,y € M: xRy — > yRx 

(6) Vx,y,z e M: xRy a yRz — > xRz. 

• • 

Nach dieser expliziten Definition ist eine Aquivalenzstruktur ein geordnetes Paar 

(Punkt 1) aus einer nicht-leeren Menge M (2) und einer auf dieser Menge definierten 

zweistelligen Relation R (3), die reflexiv (4), symmetrisch (5) und transitiv (6) ist, 

• • 

das heiBt die eine Aquivalenzrelation ~ ist. 

Eine derartige Definition nennt man eine mengentheoretische Axiomatisierung : In 
der Terminologie der Mengen, Relationen und Strukturen wird ein Konzept durch 
explizite Angabe von notwendigen oder hinreichenden Bedingungen definiert. Diese 

9Q 1 

definierenden Bedingungen werden als Axiorne bezeichnet. 

Mengentheoretische Axiomatisierungen sind in der Mathematik weit verbreitet, 
um abstrakte Konzepte (wie Metrik, Vektorraum oder Gruppe) zu definieren. In der 
strukturalistischen Wissenschaftstheorie werden sie verwendet, um empirische 
Theorien und ihre Elemente prazise zu rekonstruieren (siehe Kapitel 11.2). 

6.5.2 Modelle 

Fur das Verstandnis spaterer Kapitel dieses Buches zentral ist der Begriff des 
Modells einer Struktur. 

• Wenn die Axiome der Definition einer bestimmten Struktur in einem konkreten 
Fall erfiillt sind, ist die betreffende konkrete Struktur ein Modell des definierten 
abstrakten Konzepts. 



Weiner (1988, S. 270) 

290 Reinhardt & Soeder (1978, S. 31), Suppes (1960, S. 69, 80) 

291 

Genau genommen handelt es sich um die Definition eines mengentheoretischen 
Pradikats (hier: „ist eine Aquivalenzstruktur 44 ), die durch eine Axiomatierung in 
informell-mengentheoretischen Begriffen erfolgt (Stegmiiller, 1985, S. 39). Zum Begriff 
des Axioms siehe Kapitel 11.1 
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0 P ist eine Menge von Patienten mit Wahnvorstellungen, die Relation R ist die 
diagnostische Einteilung der Patienten in sieben Subtypen. Sind diese Untermengen 
disjunkt und erschopfend, ist R eine Aquivalenzrelation und die empirische Struktur 
(P,R) ist ein Modell einer Aquivalenzstruktur (M,~). 

Wenn die Axiome, durch die ein Konzept definiert wird, in einer bestimmten 
moglichen Anwendung nicht gelten, liegt kein Modell dieses Konzepts vor. 

0 Bei einer Befragung sagt eine Abiturientin, dass sie in Dresden genau so gern wie in 
Leipzig und in Leipzig genau so gern wie in Jena studieren mochte. AuBerdem gibt sie 
an, dass sie lieber in Dresden als in Jena studieren mochte. Lur sie sind Dresden und 
Leipzig sowie Leipzig und Jena gleichwertig, nicht aber Dresden und Jena. Ihre Urteile 
verstoBen damit gegen die Bedingung (6) aus (5-10), das heiBt sie sind nicht transitiv. Sie 

292 

konnen deshalb nicht zu einer Aquivalenzstruktur fiihren. 

Der hier eingefuhrte Begriff des Modells stammt aus der mathematischen Modell- 
theorie. Ansonsten versteht man in Wissenschaft und Alltag unter einem Modell 
meist ein „Abbild“, eine vereinfachte, verkleinerte oder versuchsweise Veranschau- 
lichung, die in wesentlichen Merkmalen dem „Urbild“ analog oder ahnlich ist. Ein 
Modell kann aber auch eine Art Vorbild sein. 

0 Ein Globus ist ein Modell der Erde, betriebliche Ablaufe werden durch Schaubilder 
modelliert , politische MaBnahmen konnen an auslandischen Modellen orientiert sein. 

6.5.3 Ordnungsstrukturen 

Ordnungsrelationen miissen transitiv sein, sie diirfen aber nicht symmetrisch sein. 

• Eine Relation R auf M x M ist eine starke Ordnungsrelation, wenn sie transitiv 
und asymmetrisch ist . 293 

Beispiele fur starke Ordnungsrelation sind die Relationen „groBer als“ (>) und 
„kleiner als“ (<) bei Zahlen. Die Strukturen (P, >) und (P, <) sind daher starke 
Ordnungsstrukturen oder kurz starke Ordnungen. 

Empirisch entsteht eine starke Ordnung immer dann, wenn wir Personen oder 
Objekte gemaB der gemessenen, wahrgenommenen oder eingeschatzten Auspragung 
eines bestimmten Merkmals in eine Rangordnung bringen. Zur Unterscheidung von 
der GroBer-Relation zwischen Zahlen, bezeichnen wir starke Ordnungsrelationen, 
die sich auf nicht-numerische Objekte beziehen, durch das Symbol A. 



292 Derartige VerstoBe gegen die Transitivitat konnen dadurch zustande kommen, dass die 
subjektiven Unterschiede zwischen den zuerst verglichenen Stadten sehr gering waren, 

zwischen Dresden und Jena aber einen kritischen Schwellenwert iiberschreiten. 

293 

R ist asymmetrisch gdw xRy — > — i(yRx) fur Vx,y e M. Die starke Ordnungsrelation 
wird auch als strenge Ordnungsrelation (Reinhardt & Soeder, 1978, S. 43) oder als strict 
partial order (Suppes, 1960, S. 72) bezeichnet. 
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0 Bei der Behandlung eines phobischen Patienten werden die angstauslosenden Situationen 
zunachst identifiziert und dann nach dem AusmaB der ausgelosten Angst angeordnet. 294 
Diese „Angsthierarchie“ entspricht einer Ordnungsstruktur (A, y), die aus einer Menge A 
von angstauslosenden Situationen und einer starken Ordnungsrelation >- besteht. 

Zu beachten ist wiederum, dass empirische Urteile liber GroBen oder Rangordnungen 
nur dann tatsachlich zu Ordnungsrelationen und -strukturen fiihren, wenn die Urteile 
transitiv sind. Zustande kommen konnen Intransitivitaten bei menschlichen 
Beurteilungen durch Unaufmerksamkeiten oder andere Zufallseinflusse, durch 
systematische Veranderungen der Auffassungen sowie vor allem dadurch, dass beim 
GroBenvergleich verschiedener Objekte unterschiedliche Merkmale oder Kriterien in 
den Vordergrund gestellt werden. 

0 Ein Kunde gibt bei einer Befragung durch einen Marktforscher an, dass er lieber Wein als 
Sekt und lieber Sekt als Bier trinkt. Spater gibt er an, dass er lieber Bier als Wein trinkt. 
Diese Intransitivitat konnte dadurch entstanden sein, dass der Befragte bei seinen 
Beurteilungen zunachst an ein gutes Essen in einem gepflegten Lokal gedacht hat, spater 
aber an die Durstbekampfung nach einem langen Tag auf seiner Baustelle. 

Partielle und vollstandige Ordnungen 

Ordnungsrelationen miissen nicht konnex sein. 295 Das heiBt, es ist zulassig, dass flir 
einige Objektpaare keine Information liber die Rangordnung der beiden Objekte 
hinsichtlich des betrachteten Merkmals vorliegt. Die Elemente der Objektmenge M 
werden dann nur teilweise geordnet. In der graphischen Darstellung entspricht eine 
partielle Starke Ordnung einem baumartigen Netz. 



Staatspriifung 




Abbildung 6.3: Beispiel flir eine partielle Ordnung: angstauslosende Situationen 

0 Das Ergebnis einer Befragung eines Sozialphobikers ist in Abbildung 6.3 veran- 
schaulicht. Eindeutig am meisten Angst hat der Patient vor seiner juristischen 
Staatspriifung, die als Gruppenpriifung vor zahlreichen Priifern stattfindet. Die flir ihn 
weiterhin angstauslosenden Situationen zerfallen in zwei Bereiche: Leistungssituationen 
und soziale Situationen. Innerhalb der Leistungssituationen hat er am meisten Angst vor 



294 

295 



Davison & Neale (1996, S. 645-646) 

R ist konnex gdw xRy v yRx flir alle x,y e M. 
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Vorstellungsgesprachen bei moglichen ktinftigen Arbeitgebern, dann vor Referaten und 
schlieBlich vor Diskussionen in Seminaren. Bei den sozialen Ereignissen macht ihm seine 
anstehende Hochzeitsfeier am meisten Angst, danach der Besuch einer groBeren Party, 
auBerdem hat er Angst sowohl vor Restaurant- wie vor Kaufhausbesuchen. Nicht 
festgestellt werden konnte, ob beispielsweise die Angst vor Vorstellungsgesprachen 
groBer oder kleiner ist als die Angst vor der Hochzeitsfeier. Auf der Menge A der acht 
angstauslosenden Situationen ist somit eine Starke Ordnungsrelation >- definiert, die nicht 
konnex ist. Die Struktur (A, >-) ist also eine partielle Ordnung. 

Ist die Ordnungsrelation dagegen nicht nur asymmetrisch und transitiv, sondern auch 
konnex, d.h. gilt x >- y oder y >- x ftir alle Paare (x, y) von Elementen der Objekt- 
menge M, liegt eine vollstandige Ordnung der Elemente von M vor. Sie wird 
entsprechend ihrer graphischen Darstellung auch als Kette bezeichnet wird. 

0 Betrachten wir im letzten Beispiel nur die angstauslosenden Leistungssituationen A’ = 
{ Staatsprlifung, Vorstellung, Referat, Diskussion}, ist die transitive und asymmetrische 
Ordnungsrelation >- konnex. Die Struktur (A’, >-) ist damit eine vollstandige Ordnung. 

Auch psychologische Theorien enthalten etliche Begriffe, die partiellen Ordnungen 
entsprechen. 

0 In der ACT*-Theorie wird das prozedurale Wissen durch Produktionen (Bedingungs- 
Aktions-Paare) beschrieben. Das prozedurale Gedachtnis besteht aus Bedingungs- oder 
Musterknoten, die teilweise verbunden und hierarchisch geordnet sind. Es entspricht 
damit einer partiellen starken Ordnung. 

Quasi-Ordnungen 

Neben der starken Ordnung konnen noch andere Ordnungsrelationen definiert 
werden. Ftir die Charakterisierung der Begriffe in den empirischen Wissenschaften 
ist eine Ordnungsrelation sehr relevant, die etwas missverstandlich als Quasi- 
Ordnungsrelation bezeichnet wird . 298 



296 simple ordering bei Suppes (1960, S. 72) 

297 Anderson (1983, S. 30-32), Heise (1991, S. 33, 37) 

298 

In der Mathematik wird haufig nicht die Starke, sondern eine schwache Ordnung als 
Ausgangpunkt ftir den Aufbau des Systems der Ordnungsstrukturen genommen 
(Fraunholz et al., 1971, S. 210; Reinhardt & Soeder, 1978, S. 43; Suppes, 1960, S. 72). 
R ist eine schwache Ordnungsrelation , wenn sie reflexiv, antisymmetrisch und transitiv 
ist (z.B. < und cz). R ist antisymmetrisch gdw xRy a yRx — > x = y ftir V x,y e M. Bei 
empirischen Relationen stellt die Antisymmetric meist keine sinnvolle Eigenschaft dar. 
Ist beispielsweise Person x nicht intelligenter als y und ist y nicht intelligenter als x, 
dann sind beide Personen natlirlich nicht gleich oder identisch, sondern Equivalent: xRy 
a yRx — > x ~ y. Dies ist der Fall, wenn R eine Quasi-Ordnungsrelation ist. Die Quasi- 
Ordnungen werden teilweise als „weak orders^ bezeichnet (Krantz, Luce, Suppes & 
Tversky, 1971, S. 14). 
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Eine Quasi-Ordnungsrelation ist eine Kombination aus einer Aquivalenzrelation ~ 
und einer starken Ordnungsrelation y 299 Quasi-Ordnungen sind in der Psychologie 
sehr haufig anzutreffen. 300 

0 Bei der Besetzung einer Stelle werden im ersten Auswahlschritt alle Bewerber (Menge B) 
in drei Gruppen eingeteilt (geeignet, bedingt geeignet, ungeeignet). Zwischen Bewerbern 
aus verschiedenen Gruppen ist damit eine Starke Ordnungsrelation >- erzeugt, wahrend die 
Bewerber innerhalb einer Gruppe als aquivalent (~) eingestuft worden sind. Insgesamt ist 
eine vollstandige Quasi-Ordnung hergestellt. 

0 Maslow unterscheidet ftinf Kategorien, in die alle menschlichen Bedtirfnisse eingeordnet 

werden konnen: Physiologische Bedtirfnisse, Sicherheitsbedtirfnisse, Kontakt- und 

Liebesbediirfnissen, Selbstachtungsbedlirfnisse, Selbstverwirklichungsbedlirfnisse. Diese 

ftinf Kategorien werden in Form einer Hierarchie von niederen zu hoheren Bedtirfnissen 

angeordnet, und es wird angenommen, dass ein Bedtirfnis auf einer hoheren Stufe erst 

301 

dann auftritt, wenn die Bedtirfnisse der darunter liegenden Ebene erfiillt sind. 
Bezeichnen wir die Menge menschlichen Bedtirfnisse mit B, gibt es nach Maslows 
Konzeption also stets eine Quasi-Ordnung mit ftinf Aquivalenzklassen. 

0 Nach Kohlberg entwickelt sich das moralische Urteil von Menschen in sechs Stufen von 
der Orientierung an Strafe und Gehorsam bis zur Orientierung an universellen ethischen 
Prinzipien. Dabei kann keine Stufe tibersprungen werden und die Reihenfolge der 
Stufen ist nicht umkehrbar. Jede Einteilung einer Menge von Personen nach der 
erreichten Stufe ihrer Moralentwicklung muss von daher eine Quasi-Ordnung ergeben. 

Komparative Begriffe 

Wissenschaftliche Begriffe, die einer der verschiedenen Ordnungsrelationen oder 
-strukturen entsprechen, werden als ordinale oder komparative Begriffe bezeichnet. 
Sie kommen in der Psychologie sehr haufig vor. 

0 Komparative Begriffe sind: die moralische Orientierung nach Kohlberg, die Angst eines 
Phobikers vor verschiedenen Stimuli (siehe oben Seite 132) sowie die Intelligenz- 

303 

minderung nach dem ICD-10. 



299 

300 



301 

302 

303 



Eine Quasi-Ordnung ist also eine Struktur (M, >-, ~) mit einer starken Ordnungs- und 
einer Aquivalenzrelation (vgl. Leinfellner, 1967, S. 135-137). 

R ist dann eine Quasi-Ordnungsrelation, wenn sie reflexiv und transitiv ist (Fraunholz et 
al., 1971, S. 208; Kondakow, 1978, S. 406; Suppes, 1960, S. 72). Im Unterschied zu 
einer Aquivalenzrelation darf sie aber nicht symmetrisch sein. 

Maslow (1970), Weiner (1988, S. 321-325), Fisseni (1998, S. 207-216) 

Colby & Kohlberg (1984) 

Im ICD-10 (Dilling, Mombour & Schmidt, 1993, S. 253-260) werden leichte, mittel- 
gradige, schwere und schwerste Intelligenzminderungen unterschieden. 
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6.6 Abbildungen und Funktionen 

Abbildungen und Funktionen sind wichtige Spezialfalle von Relationen, die sich 

durch einen bestimmten Grad an Prazision auszeichnen. 

Abbildungen 

• Eine Relation R, die auf dem kartesischen Produkt A x B definiert ist, stellt eine 
Abbildung dar, wenn und nur wenn jedem Element der Menge A genau ein 
Element der Menge B zugeordnet wird. 

0 P sei eine Menge von Patienten und D sei eine Menge von psycho-diagnostischen 
Kategorien. R c P x D sei die Relation „hat eine diagnostizierte“. Die Relation R ist dann 
eine Abbildung, wenn jeder Patient genau eine diagnostizierte Storung hat. Ein Beispiel 
fur eine derartige Abbildung ist in Abbildung 6.4 dargestellt. 




Abbildung 6.4: Beispiel fur eine Abbildung 

6 Die unabhangige Variable eines Experiments, z.B. „Belohnungshohe“, entspricht einer 
Abbildung der Menge der Untersuchungseinheiten auf die Menge der Auspragungen 
dieses Faktors, z.B. {1 DM, 8 DM}. 

Bei einer Abbildung von A auf B kann jedes Element von B mehreren Elementen 
von A zugeordnet sein. Eine Relation ist allerdings keine Abbildung, wenn es ein 
Element von A gibt, das keinem oder mehreren Elementen von B zugeordnet ist. 

6 Bei Verwendung des Diagnosesy stems DSM-IV werden einer Person haufig mehrere 
Diagnosekategorien zugeordnet, zum Beispiel „Major Depression 44 , „Alkoholmissbrauch“ 
und „antisoziale Personlichkeit 44 . 4 Diese Zuordnungen entsprechen damit einer Relation 
auf den Mengen der Personen und Diagnosekategorien, sie stellen aber keine Abbildung 
dar. Wird jedoch jeder Person nur ihre Hauptdiagnose zugeordnet, liegt eine 
Abbildung von der Menge der Personen auf die Menge der Diagnosekategorien vor. 



Davison & Neale (1996, S. 66), DSM-IV (1996, S. 17-27) 
DSM-IV (1996, S. 6) 
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Bei einer Abbildung ist die erste Menge der Definitionsbereich, die zweite Menge 
der Bild- oder Wertebereich. Ist R eine Abbildung, schreibt man auch R: A — ► B. 
Da in Graphiken Definitionsbereiche links und Bildbereiche rechts liegen, wird eine 

oat 

Abbildung haufig als Relation definiert, die linkstotal und rechtseindeutig ist. 

Funktionen 

• Eine Abbildung ist eine Funktion genau dann, wenn der Bildbereich gleich der 
Menge P der reellen Zahlen oder einer Teilmenge davon ist. 

Funktionen sind also numerische oder quantitative Abbildungen. Sie werden (im 
Unterschied zu Relationen) meist mit Kleinbuchstaben (z.B. f) bezeichnet. 

0 Wird jedem Patienten der Intelligenzquotient (IQ) nach dem zuletzt durchgeftihrten 
Intelligenz-Struktur-Test zugeordnet, liegt eine Funktion vor. Keine Abbildung und keine 
Funktion lage beispielsweise vor, wenn einigen Patienten die IQ-Werte aus zwei 
Testverfahren zugeordnet wtirden. 

0 Die abhangige Variable eines Experiments ist eine Funktion: Sie ordnet jeder Unter- 
suchungseinheit einen empirischen Zahlenwert zu (z.B. fur ihre Meinungsauspragung). 

In psychologischen Theorien werden die Begriffe, liber die die wichtigsten 
theoretischen Annahmen gemacht werden, meist als Variablen aufgefasst, die sehr 
viele unterschiedliche GroBen annehmen konnen. Sie entsprechen damit Funktionen, 
die den interessierenden theoretischen Objekten jeweils eine reelle Zahl zuordnen. 

0 In Festingers Theorie der kognitiven Dissonanz ist jeder Kognition ein bestimmtes 
AusmaB an Dissonanzstarke zugeordnet, die ein bestimmtes AusmaB an Reduktionsdruck 
zur Folge hat. Die Begriffe der Dissonanzstarke und des Reduktionsdrucks entsprechen 
also zwei Funktionen von der Menge der Kognition in die Menge der nicht-negativen 
reellen Zahlen: disstarke : Kognitionen — > Pq+ und reddruck : Kognitionen — » Po+. 

0 In der ACT*-Theorie hat jedes Element des deklarativen Gedachtnisses zu jeder Zeit eine 
bestimmte Starke und eine bestimmte Aktivation. Die Starke erhoht sich bei jedem 
Gebrauch um eine Einheit, die Hohe der Aktivation wird von der Starke und den 
momentanen Aktivationsfliissen im Netzwerk bestimmt. Beide GroBen entsprechen 
Funktionen von der Menge der Elemente des deklarativen Gedachtnisses in die reellen 



306 

Abbildungen werden meist mit einem einfachen Pfeil — > symbolisiert. Die Pfeilform — ► 
wird hier verwendet, um Verwechslungen mit dem Implikationspfeil — > zu vermeiden. 

307 R ist linkstotal gdw VaE A 3be B: aRb. 

R ist rechtseindeutig gdw VaE A, be B: aRb — > — db’E B: aRb’. 

Eine Abbildung, die nicht nur linkstotal und rechtseindeutig ist, sondern auch 
rechtstotal und linkseindeutig, heiBt umkehrbar eindeutig, eineindeutig oder bijektiv. 
Eine Abbildung ist surjektiv , wenn sie nicht nur links-, sondern auch rechtstotal ist. Eine 
Abbildung ist injektiv , wenn sie nicht nur rechts-, sondern auch linkseindeutig ist. 

308 In der Mathematik werden die Begriffe Abbildung und Funktion oft gleichgesetzt 
(Dallmann et al., 1991, S. 71). Wir trennen sie hier, weil es in der Psychologie wichtig 
ist, ob eine Abbildung numerisch ist oder nicht (vgl. Steyer & Eid, 1993, S. 321-323). 
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Zahlen, d.h. starke: Deklaratives Gedachtnis — » Po+ und aktivation: Deklaratives 
Gedachtnis — > P ()+ . 

0 Nach der Rubikontheorie hat jedes Ziel eine bestimmte Motivations starke. Wenn eine 
Person die Intention gebildet hat, ein Ziel zu erreichen, kommt dieser Zielintention eine 
bestimmte Volitions starke zu. Diese ist zum einen von der Motivationsstarke abhangig, 
zum anderen kann sie bei einer erhohten Tatigkeitsschwierigkeit kurzfristig erhoht 
werden. Die zentralen Begriffen der Motivations- und Volitionsstarke entsprechen somit 
Funktionen motivation : Ziele — » P und volition : Zielintentionen — > P. 

Wissenschaftliche Begriffe, die als Funktionen zu charakterisieren sind, werden als 
quantitative Begriffe bezeichnet. Wenn bestimmte Bedingungen erfullt sind und die 
Abstande zwischen den zugeordneten Zahlen sinnvoll zu interpretieren sind, spricht 
man von metrischen Begriffen . 309 

0 Wenn eine Psychologin die Feststellung trifft, dass die Eheleute Schmidt sich in ihrem 
Temperament mehr unterscheiden als die Eheleute Muller, setzt sie (implizit) voraus, dass 
Temperament ein metrischer Begriff ist. 



6.7 Abbildungen von Strukturen 

Fur die psychologische Forschungsmethodik ist von groBer Bedeutung, dass nicht 
nur Mengen abgebildet werden konnen, sondern auch Strukturen. Eine Abbildung 
einer Struktur A in eine Struktur B liegt vor, wenn die Elemente der Objektmenge 
von A durch eine Funktion f so in die Objektmenge von B abgebildet werden, dass 
jede Relation zwischen den urspriinglichen Elementen durch eine entsprechende 
Relation zwischen den Bildelementen widergespiegelt wird. 

Man spricht in diesem Fall von einer strukturerhaltenden oder homomorphen 
Abbildung, kurz auch von einem Homomorphismus zwischen A und B . 310 

Von besonderem Interesse sind homomorphe Abbildungen, wenn eine Struktur 
aus empirischen Objekten und Relationen besteht, die andere hingegen aus reellen 
Zahlen und numerischen Relationen: 

• Wenn eine empirische Struktur in eine numerische Struktur homomorph 
abgebildet wird, spricht man von Messen . 311 



zu qualitativen, ordinalen und metrischen Begriffen: Hempel (1974), Leinfellner (1967) 

310 Es seien A = <A, Rj, ..., R n > und B = <B, Si, ..., S n > zwei Strukturen des gleichen Typs. 
Die Abbildung f von A in B ist eine homomorphe Abbildung (ein Homomorphismus), 
wenn fur alle ai,a 2 e A und alle i = 1,..., n gilt: Wenn ajR^, dann f(ai)S;f(a 2 ). Ist/eine 
bijektive Abbildung, stellt der Homomorphismus einen Isomorphismus dar. 

311 Eine Struktur <M, R ] . ..., R n > heiBt empirisch, wenn M eine Menge empirischer Objekte 
ist und wenn R 1? ..., R n beobachtbare Relationen sind. 

Eine Struktur <M, R | . ..., R n > heiBt numerisch, wenn M eine Menge von Zahlen ist. 
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0 A sei die Menge von Zielen, die eine Person erreichen mochte: A = {Wohnung, 
Hilfskraftstelle, Segelschein, Vordiplom}. Wir legen ihr alle moglichen Paare dieser Ziele 
vor. Sie gibt jeweils an, welches dieser beiden Ziele ihr wichtiger ist. Das Ergebnis dieses 
Paarvergleichs ist eine empirische Praferenzrelation >- c A x A, zum Beispiel >- = 
{(Wohnung, Vordiplom), (Wohnung, Hilfskraftstelle), (Wohnung, Segelschein), 
(Vordiplom, Hilfskraftstelle), (Vordiplom, Segelschein), (Hilfskraftstelle, Segelschein)}. 
Um die empirische Struktur (A,>~) homomorph auf eine numerische Struktur (P,>) 
abzubilden, ordnen wir jedem a* von A eine Zahl so zu, dass sie die Praferenzurteile 
eindeutig widerspiegeln: Die numerische GroBenrelation f(aO > f(aj) soli aj genau dann 
gelten, wenn a* >- aj gilt. Eine von vielen Zuordnungen, die diese Forderung erflillt, ist 
f(Wohnung) = 100, f(Vordiplom) = 50, f(Hilfskraftstelle) = 30; f(Segelschein) = 10. 

Von der Art der abgebildeten Relation hangt das Skalenniveau der Messung ab. 
Umfasst die empirische Struktur nur eine Ordnungsrelation, konnen die den 
Objekten zugeordneten Zahlen nur die empirische Ordnung widerspiegeln. Alle 
anderen Relationen zwischen den zugeordneten Zahlen sind empirisch nicht 
bedeutsam. 

0 Aus der Zahlenzuordnung im letzten Beispiel folgt nicht, dass fur unsere Person die 
Wohnung doppelt so wichtig ist wie das Vordiplom. 

Man spricht in diesem Fall von einer Messung auf Ordinalskalenniveau. 312 



312 

Einfuhrungen in die Messtheorie: Coombs, Dawes & Tversky (1975, Kap. 2), 
Gigerenzer (1981), Orth (1974, 1983), Steyer & Eid (1993, Kap. 2-8); umfassendere 
Darstellungen: Krantz, Luce, Suppes & Tversky (1971), Roberts (1979). 





7 Kausalitat und wissenschaftliche Gesetze 



Ein wesentliches Ziel der Wissenschaft besteht darin, beobachtbare Sachverhalte zu 
erklaren. Worm eine wissenschaftliche Erklarung bestehen kann, wird im Kapitel 8 
besprochen. Dabei werden wir sehen, dass adaquate wissenschaftliche Erklarungen 
auf gesetzmaBige und ursachliche Zusammenhange zwischen verschiedenen 
Variablen Bezug nehmen. Deshalb gehen wir zunachst auf wissenschaftliche Gesetze 
ein (Kapitel 7.1), anschlieBend wird der Begriff der Kausalitat oder Ursachlichkeit 
expliziert (Kapitel 7.2). Die Thematiken der GesetzmaBigkeit, der Kausalitat und der 
Erklarung sind eng miteinander verbunden. Deshalb wird es bei den folgenden 
Darstellungen nicht immer vermeidbar sein, auf spater dargestellte Sachverhalte 
vorzugreifen. 



7.1 Wissenschaftliche Gesetze 

Der Begriff des Gesetzes wird in alien empirischen Wissenschaften verwendet, vor 

Q 1 Q 

allem in den klassischen Naturwissenschaften. 

0 Aus der Physik bekannt sind das Fallgesetz (die Fallstrecke ist proportional dem Quadrat 
der Fallzeit), die Kepplerschen Gesetze (liber Planetenbahnen und -geschwindigkeiten) 
und das Ohmsche Gesetz (Stromfluss ist gleich Spannung durch Widerstand). AuBerdem 
gibt es mechanische und optische Gesetze, Stromungsgesetze, Strahlungsgesetze usw. 314 

In der Psychologie spricht man vergleichsweise selten von Gesetzen. 

0 Allgemein bekannt sind das Webersche und das Fechnersche Gesetz sowie das 

Stevenssche Potenzgesetz aus der Psychophysik, das gestaltpsychologische Pragnanz- 

gesetz aus der Wahrnehmungspsychologie, Thorndikes Effektgesetz aus der 

315 

Lernpsychologie und das Yerkes-Dodson-Gesetz aus der Motivationspsychologie. 
AuBerdem werden in der Kognitionspsychologie die Potenzgesetze des Lernens und des 
Vergessens beschrieben. 316 



Betrachtet werden hier empirische, nicht logische Gesetze (vgl. Kapitel 3.4.3). 
Breuer (1994, 1996) 

Zimbardo (1995, S. 170-172, 275-276), Zimbardo (1992, S. 432) 

Anderson (1996a) 
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Sind Gesetze systematisch miteinander verkntipft, spricht man von einer Theorie , 317 

0 Die Dissonanztheorie beinhaltet eine grundlegende Gesetzesannahme (das Fundamental- 
gesetz: „Je starker die Dissonanz, desto hoher der Druck, sie zu reduzieren 44 ) sowie 
etliche spezielle Gesetzesannahmen liber die Determinanten der Dissonanz und die 

Konsequenzen des Reduktionsdrucks (z.B. „Je wichtiger eine Entscheidung ist, desto 

318 

groBer ist die Dissonanz nach der Entscheidung"). 

In diesem Kapitel werden die Merkmale besprochen, durch die sich wissen- 

3 1 Q 

schaftliche Gesetze von nicht-gesetzesmaBigen Aussagen unterscheiden. Jedes 
dieser Merkmale ist eine notwendige Bedingungen dafiir, dass eine Aussage ein 
Gesetz darstellt. Bislang sind jedoch keine Merkmale identifiziert worden, die 
zusammen genommen hinreichend dafiir sind, dass ein Gesetz vorliegt. 

7.1.1 Wahrheit und Bestatigung 

Ein erstes notwendiges Merkmal von wissenschaftlichen Gesetzen scheint darin zu 
bestehen, dass sie wahr oder zumindest auf Grund von Beobachtungen gut bestatigt 
sind. Allerdings konnen wir nie sicher sein, dass eine Aussage empirisch wahr oder 
bewahrt ist. Oft sind lange fur wahr gehaltene Gesetze spater als falsch erkannt 
worden und bei vielen Gesetzen ist umstritten, ob sie gut bestatigt sind oder nicht. 
Deshalb konnen wir Gesetze nur im Sinne von gesetzesartigen Aussagen oder 
Gesetzesannahmen verstehen. Sie mtissen nicht unbedingt gut bestatigt sein, sie 
dtirfen aber auch nicht bereits widerlegt oder stark erschuttert sein. 

0 Fur sehr groBe und sehr kleine Reize zeigen sich empirisch deutliche und regelmaBige 
Abweichungen vom Weberschen Gesetz. Das Fechnersche Gesetz bewahrt sich zwar fur 
kategoriale Urteile, nicht aber fur direkte GroBen- und Verhaltnisschatzungen. 1 
Trotzdem spricht man in der Wahrnehmungspsychologie durchgangig vom Weberschen 
und vom Fechnerschen Gesetz, weil diese Zusammenhangsannahmen sich zumindest 
approximativ gut bewahrt haben. 

7.1.2 Funktionale und implikative Verknupfungen 

Wissenschaftliche Gesetze zeichnen sich dadurch aus, dass sie eine Verkniipfung 
(eine Verbindung, einen Zusammenhang) zwischen zwei oder mehr Zustanden, 
Ereignissen, GroBen oder Variablen beschreiben. Aussagen iiber einzelne Ereignisse, 
Mittelwerte, Haufigkeiten oder Naturkonstanten konnen keine Gesetze sein: 



317 Zur adaquateren Explikation des Begriffs einer Theorie siehe Kapitel 11. 

318 Festinger (1978) 

319 erganzend: Stegmiiller (1983, Kapitel V), Sprung & Sprung (1987, S. 82-90), Opp 
(1976, S. 73-81) 

320 

zu notwendigen vs. hinreichenden Bedingungen siehe oben Kapitel 3.2.3 

321 Gescheider (1985), Westermann (1987b) 
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0 „die Gravitiationskonstante g betragt 6,672 x I O' 1 1 “ 322 
6 „das Erkrankungsrisiko fur Schizophrenie betragt etwas weniger als 1 %“ 323 
6 „bei Little Albert wurde die auf eine we i Lie Ratte konditionierte Furcht auch auf einen 
weiBen Bart generalisiert“. 

In Abhangigkeit von der Art der verwendeten Begriffe konnen quantitative, ordinale 
und nominale Verkniipfungen unterschieden werden. 



Quantitative Gesetze 



In der Physik werden Gesetze in der Regel als funktionale Beziehung zwischen zwei 
oder mehreren quantitativen Variablen formuliert. 



0 Nach dem Gravitationsgesetz von Isaac Newton ergibt sich die Anziehungskraft F 

325 

zwischen zwei Korpern mit den Massen nq und m 2 und dem Abstand r aus 



(7-1) 



F=g 



m 1 m 2 



Dabei ist g die bekannte Gravitationskonstante. 



326 



Auch in der Psychologie gibt es einige GesetzmaBigkeiten, die sich als quantitative 
Funktionen formulieren lassen. 



0 Nach Fechners Gesetz ist die subjektive GroBe R einer Reizempfindung eine 

327 

logarithmische Funktion der physikalischen ReizgroBe S: 

(7-2) R = a log S + b. 

Dabei sind a und b allerdings keine universellen Konstanten, sondern von den 
spezifischen Reizen, Personen und Situationen abhangig. 



Ordinale Gesetze 

Gesetzesannahmen in der Psychologie entsprechen haufig keinen prazisen 
Funktionsregeln, sondern Annahmen iiber monotone Zusammenhange zwischen 
verschiedenen Variablen. Sie konnen in Satzen mit „je desto oder „um so“ 
formuliert werden, es finden sich aber auch viele andere sprachliche 

398 

U ms chreibungen . 



322 

323 

324 

325 

326 



327 

328 



Breuer (1994, S. 45) 

Davison & Neale (1996, S. 464) 

Meyer, Schtitzwohl & Reisenzein (1993, S. 62-63) 

Breuer (1994, S. 45) 

Auch dieses grundlegende physikalische Gesetz ist nicht absolut wahr. Zum einen gilt es 
streng genommen nur fiir punktformige Korper, d.h. fiir Korper, die eine Masse, aber 
keine Ausdehnung haben. Zum anderen ist nach Einsteins Relativitatstheorie die 
Anziehung von Korpern auch von ihrer (relativen) Geschwindigkeit abhangig. 

Prinz (1990), Westermann (1987b) 

Dass monotone Beziehungen angenommen werden, ist haufig aus dem Wortlaut nicht 
ersichtlich (z.B. bei „hangt ab von“ oder „fiihrt zu“, siehe unten Kapitel 11.3.2). 
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0 Je groBer die Dissonanz ist, desto groBer ist der Druck, sie zu reduzieren. 329 
0 Die aktuelle Volitionsstarke oder Anstrengungsbereitschaft ist umso hoher, je schwieriger 
die Tatigkeit ist. 330 

0 Die Aktivationshohe eines Gedachtnisknotens ist eine positive Funktion seiner Starke. 331 

Nominale Gesetze 

In der Psychologie finden wir haufig auch Gesetzesannahmen liber Zusammenhange 
zwischen verschiedenen kategorialen (nominalen oder qualitativen) Zustanden oder 
Ereignissen. Sie konnen als Konditionalsatze formuliert werden („Wenn ..., dann 
...“), es gibt aber auch elegantere sprachliche Konstruktionen. 

0 „Wenn eine Person eine Entscheidung zwischen zwei Alternativen getroffen hat, dann 
entsteht bei ihr Dissonanz. 44332 

0 Wenn der Bedingungsteil einer kognitiven Produktionsregel hinreichend genau mit der 
deklarativen Struktur libereinstimmt, wird diese Produktion ausgefuhrt. 333 
0 Ist das Ziel nicht erreicht, werden Vermutungen liber Ursachen des Misserfolgs 

.. r\ 334 

geprutt. 

Gesetze als implikative Verkniipfungen 

Nicht nur nominale, sondern auch funktionale und monotone Gesetzesannahmen 
konnen als „Wenn dann ...“-Aussagen formuliert werden. 

0 Das Fechnersche Gesetz entspricht der Aussage „Wenn ein Reiz die physikalische GroBe 
S hat, dann hat die entsprechende Empfindung die GroBe R = a log S + b. 

Die konditionale Verbindung zweier Teilaussagen ist deshalb ein gemeinsames 

335 

Merkmal der bisher betrachteten wissenschaftlichen Gesetze. Logisch konnen 
diese Wenn-dann- Aussagen mit Hilfe von Implikationen rekonstruiert werden. 

0 U ist die Aussage „eine Person hat eine Entscheidung getroffen 44 , V die Aussage „bei der 
Person entsteht Dissonanz 44 . Die Gesetzesannahme „Wenn eine Person eine Entscheidung 
zwischen zwei Alternativen getroffen hat, dann entsteht bei ihr Dissonanz 44 kann dann 
vorlaufig durch die Implikation U — > V dargestellt werden. 



329 

330 

331 

332 

333 

334 

335 



Festinger (1978, S. 30) 

Heckhausen (1989, S. 215) 

Anderson (1983, S. 22-23) 

Festinger (1978, S. 47) 

Anderson (1983, S. 23) 

Heckhausen (1989, S. 217) 

Nach Goodman (1973) besteht eine entscheidende notwendige Bedingung fur die 
Gesetzesartigkeit einer Aussage in der Projektierbarkeit der verwendeten Pradikate 
(Stegmiiller, 1983, S. 322-328). Dieses Kriterium wird hier nicht besprochen, da es fur 
tatsachliche Gesetzesannahmen in aller Regel als erfiillt angesehen wird. 
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Treten die Pramisse und die Konklusion dieser Verkniipfung (im wesentlichen) 
gleichzeitig auf, spricht man von einem Koexistenzgesetz. Liegt die Pramisse zeitlich 
vor der Konklusion, handelt es sich um ein Sukzessionsgesetz. 

7.1.3 Allgemeinheit 

Ein wesentliches Merkmal eines wissenschaftlichen Gesetzes besteht darin, dass es 
eine allgemeine Aussage liber einzelne Objekte macht: eine Aussage, die auf jedes 
einzelne Element einer bestimmten Menge von interessierenden Objekte zutreffen 
soil, nicht nur auf einige der betrachteten Dinge, Personen, Gruppen, Situationen 
usw. Um ein wissenschaftliches Gesetz logisch darzustellen, geniigt deshalb eine 
aussagenlogische Implikation der Form U — » V nicht. Ein Gesetz entspricht eher 
einer pradikatenlogischen Aussagenform mit einem Allquantor: 

(7-3) Vx: U(x) V(x). 

Je nach Gegenstandsbereich kann x ein Element aus einer Menge von bestimmten 
Personen, Gruppen, Korpern, Ideen usw. sein. 

0 Die in der Dissonanztheorie enthaltene Gesetzesannahme „Wenn eine Person eine 
Entscheidung zwischen zwei Alternativen getroffen hat, vergroBert sich die relative 
Attraktivitat der gewahlten Alternative 44 kann wie folgt geschrieben werden: 

(7—4) Vp e P: E(p) — > A(p) 

Dabei bezeichnet E das Pradikat „hat eine Entscheidung getroffen, 44 und A das Pradikat 
„ vergroBert die relative Attraktivitat der gewahlten Alternative 44 . Durch p wird eine 
Person bezeichnet, fur die die Dissonanztheorie gelten soli. 

Die Allquantifizierung kann sich auch auf verschiedene Mengen erstrecken, 
beispielsweise auf alle Kombinationen von Personen, Situationen und Zeitpunkten, 
d.h. auf alle Elemente des kartesischen Produktes der Mengen P, S und T: 

(7-5) V(x,y,z) e PxSxT: U(x,y,z) — » V(x,y,z). 

0 Das Fechnersche Gesetz vom logarithmischen Zusammenhang von subjektiven und 
objektiven ReizgroBen kann genauer formuliert werden, indem wir auf eine Menge J von 
Reizen, eine Menge P von Personen und eine Menge T von Zeitpunkten bezug nehmen: 

(7-6) V(j,p,t) e JxPxT: R(j,p,t) = a(p,t) log S(j) + b(p,t). 

Durch diese Formulierung wird zugelassen, dass die Konstanten a und b fur verschiedene 
Personen und Zeitpunkte unterschiedlich ausfallen konnen. 



336 

Die VergroBerung der (subjektiven) Attraktivitat der gewahlten Alternative, relativ zur 
nicht gewahlten Alternative, ist nach Festinger (1978) eine der wichtigsten Moglich- 
keiten, die nach einer Entscheidung entstehende Dissonanz zu reduzieren. Sie kann 
durch eine positivere Bewertung der gewahlten und/oder durch eine negativere 
Bewertung der nichtgewahlten Alternative zustande kommen. 
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In wissenschaftlichen Gesetzen muss mindestens ein Allquantor auftreten, daneben 
konnen aber auch Existenzquantoren auftreten. 

0 Nach einer modifizierten Form der Dissonanztheorie kann es unmittelbar nach einer 
Entscheidung zu einer deutlichen Erhohung der Attraktivitat der nicht-gewahlten 
Alternative kommen ( regret effect). Dadurch tritt die eigentlich vorhergesagte relative 
Attraktivitatserhohung erst nach einem (unbekannten) Mindestabstand t mH1 auf. Die 
Gesetzesannahme (7-4) muss dann entsprechend modifiziert werden, wobei neben der 
Menge P von Personen auch eine Menge T von Zeitpunkten betrachtet werden muss: 

(7-7) V(p,t) e PxT 3t m i n e T: E(p,t) — » A(p,t’) fur alle f > t + t m i n . 

7.1.4 Unerschopflichkeit 

Durch den Allquantor allein wird der wesentliche Aspekt dessen noch nicht erfasst, 
was man gemeinhin unter der Allgemeingiiltigkeit von wissenschaftlichen Gesetzen 
versteht. Entscheidend ist, dass der Allquantor sich unbedingt auf eine Menge 
beziehen muss, die offen ist, d.h. unendlich viele Elemente umfasst. Eine Allaussage, 
die sich auf eine abgeschlossene, endliche Menge von Objekten bezieht, kann kein 
wissenschaftliches Gesetz sein. 

0 Eine Aussage liber „alle 1999 an der Freien Universitat Berlin Studierenden“ bezieht sich 
auf eine endliche Menge von Objekten, auch wenn die Menge relativ groB ist. 

0 Eine Aussage, die sich auf „alle Studierenden“ bezieht, ist eine Aussage liber eine offene 
Menge von Personen. Selbst wenn wir Millionen von Studierenden bereits untersucht 
haben: Es konnen in der Zukunft immer noch neue hinzukommen. 

Dieses Abgrenzungskriterium von gesetzmaBigen Aussagen gegeniiber nicht- 
gesetzesmaBigen Aussagen kann anschaulich als Unerschopflichkeit bezeichnet 
werden: Ein wissenschaftliches Gesetz bezieht sich immer auf mehr Falle, als bisher 
aufgezahlt oder beobachtet worden sind. 

Psychologische Theorien mit unbegrenztem Anwendungsbereich 

Bei psychologischen Theorien wird der anvisierte Geltungsbereich meist nicht 
explizit angegeben. Aus den Darstellungen der Theorie lasst sich aber recht eindeutig 
ablesen, dass sie sich nicht auf endliche, sondern auf unbeschrankte, offene Mengen 
von Situationen, Zeitpunkten und Personen beziehen. 

337 

0 Die allgemeinpsychologische Kognitionstheorie ACT von Anderson soil grundsatzlich 
fiir alle Arten von kognitiven Aufgaben und Aktivitaten gelten sowie fur alle Menschen, 
die gegenwartig leben, frliher gelebt haben oder irgendwann einmal leben werden. 
(Eventuell mtissen dabei extrem stark geistig behinderte Menschen ausgenommen 
werden.) 



337 



Anderson (1993) 
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338 

0 Das Risiko-Wahl-Modell von Atkinson gilt zwar nur fur bestimmte Arten von 
Leistungs- und Konfliktsituationen, dann aber grundsatzlich fur eine uneingeschrankte 
Menge von Personen. 

0 Organisations- und unterrichtspsychologische Theorien beziehen sich auf alle moglichen 
Personen, die sich in den entsprechenden betrieblichen bzw. schulischen Situationen 
befinden. (Wegen der eingeschrankten Bezugssituationen kann bei diesen Theorien die 
Gtiltigkeit auf bestimmte Kulturen oder Gesellschaftssysteme eingeschrankt sein.) 

0 Entwicklungspsychologische Theorien beziehen sich meist auf alle Menschen in einem 
bestimmten Kapitel der Lebensspanne: Theorien zur Entwicklung metakognitiver 

Strategien auf Kinder im Vorschul- und Schulalter, Theorien zum erfolgreichen Altern 

339 

auf Menschen im hoheren Erwachsenenalter. 

Die Unerschopflichkeit des Anwendungsbereiches eines Gesetzes muss nicht 
unbedingt darin bestehen, dass es sich auf unendlich viele Personen bezieht. Ein 
Gesetz kann sich auch auf endlich viele Personen oder im Extremfall nur auf eine 
einzelne Person beziehen. In diesem Fall ist der Anwendungsbereich dann 
unerschopflich, wenn er fur diese Personen unendlich viele Zeitpunkte, Situationen 
oder Aktivitaten umfasst. 

0 Beim Patienten A.B. kommt es immer dann zu schizophrenen Schiiben, wenn sie 
familiare Schwierigkeiten haben. 

Psychologische Aussagen mit begrenztem Anwendungsbereich 

Die Unerschopflichkeit ist ein sinnvolles und unbedingt notwendiges Kriterium zur 
Abgrenzung von gesetzmaBigen Aussagen: Wissenschaftliche Gesetze sollen mehr 
aussagen als wir bereits aus der Erfahrung wissen oder wissen konnten. 

Aussagen, die sich nur auf einen eindeutig begrenzten Anwendungsbereich 
beziehen, zahlen wir damit nicht zu den wissenschaftlichen Gesetzesannahmen, auch 
wenn sie auf wissenschaftlichen Erkenntnissen oder Methoden beruhen. 

0 Von den gegenwartig Arbeitslosen hat mehr als die Halfte keine abgeschlossene 
B eruf sausbildung . 

0 Alle mannlichen Teilnehmer haben die Klausur bestanden. 

0 Bei diesem Patienten ist die Schizophrenic erstmalig durch den Verlust des Arbeitsplatzes 
zum Ausbruch gekommen. 

Ein wesentlicher Nachteil von Aussagen mit begrenztem Anwendungsbereich soil 
noch erwahnt werden, obwohl wir damit auf die Thematik der wissenschaftlichen 
Erklarung vorgreifen, die erst im Kapitel 8 behandelt wird. Ein Sachverhalt ist 
wissenschaftlich erklart, wenn man ihn aus Gesetzen und Anfangsbedingungen 



Atkinson (1957), Weiner (1988) 

Mecklenbrauker, Wippich & Bredenkamp (1992), Baltes & Carstensen (1996) 

340 Andere Autoren bezeichnen auch derartige Vermutungen liber Einzelereignisse und 
begrenzte Sachverhalte als wissenschaftliche Hypothesen (Groeben & Westmeyer, 
1975, S. 113-114; Hussy & Moller, 1994, S. 476-479). 
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logisch ableiten kann. Wiirde man auch Erklarungen durch wahre Allaussagen 
akzeptieren, die sich nur auf endliche Mengen beziehen, konnte man jeden 
beliebigen Sachverhalt einfach dadurch erklaren, dass dieser Fall zu einer 
bestimmten Teilmenge von gleichartigen Fallen gehort. 

0 Es soli erklart werden, warum Sonja sich entschieden hat, Psychologie zu studieren. Wir 
untersuchen dazu Sonja und weitere 19 Abiturienten etwas genauer und stellen unter 
anderem fest: Die 5 Personen, die Psychologie studieren wollen, sind alle weiblich und 
haben einen Intelligenzquotienten von zwischen 110 und 115. Die weiblichen Personen in 
dieser Gruppe, die nicht Psychologie studieren, haben einen IQ unter 110 oder iiber 115. 
Auf Grand dieser Ergebnisse ist fur diese Menge von 20 Abiturienten die folgende 
Konditionalaussage zutreffend: „Wenn eine Person weiblich ist und einen IQ zwischen 
110 und 115 hat, dann entscheidet sie sich fur ein Psychologiestudium“. 

Derartige Argumente sind keine adaquaten wissenschaftlichen Erklarungen, weil sie 
nur auf relativ zufalligen Merkmalskonfigurationen in bestimmten Situationen 
beruhen, die sich in anderen Situationen schon wieder anders darstellen konnen. 341 

7.1.5 Deterministisch oder probabilistisch 

Bisher haben wir nur deterministische Gesetze bzw. Gesetzesannahmen betrachtet. 
Nach einem deterministischen Gesetz muss ein bestimmtes Ereignis V mit 
Notwendigkeit und ohne Ausnahme eintreten, wenn eine bestimmte Bedingung U 
vorliegt. 

Nach einem probabilistischen Gesetz tritt das Ereignis V nur mit einer gewissen 
Wahrscheinlichkeit ein, wenn eine bestimmte Bedingungskonstellation U vorliegt. 
Es wird also eine Aussage iiber die bedingte Wahrscheinlichkeit P(V lU) gemacht. Im 
Idealfall wird ein genauer Wert p oder ein Mindestwert p’ fur diese 
Wahrscheinlichkeit spezifiziert, d.h. zum Beispiel P(V lU) = 0,33 oder P(V lU) > 
0,80. 342 



341 

Derartige nicht gesetzesmaBig wahre Aussagen heiBen akzidentell oder kontingent. 

342 

Bei gleichwahrscheinlichen Ereignissen ist die Wahrscheinlichkeit eines Ereignis der 
Quotient aus gtinstigen und moglichen Fallen definiert. Bei unabhangigen 
Wiederholungen eines Zufallsexperiments wird die Wahrscheinlichkeit als Grenzwert 
der relativen Haufigkeit interpretiert. In den empirischen Wissenschaften spricht man 
von der Wahrscheinlichkeit eines Ereignisses auch dann, wenn es weder 
gleichwahrscheinliche Ereignisse noch Wiederholungen unter gleichen Bedingungen 
gibt. Wahrscheinlichkeit bezeichnet dann die Neigung (propensity) eines bestimmten 
Ereignisses, in einer bestimmten Situation einzutreten (Frick, 1998; Popper, 1985, 1990; 
Williams, 1999). Diese singularen Wahrscheinlichkeiten konnen durch wiederholte 
Beobachtungen unter relativ konstanten Bedingungen geschatzt werden. 
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7.1.5.1 Physikalische GesetzmaBigkeiten 

Ob wissenschaftliche Gesetze deterministisch oder probabilistisch sein sollen oder 
sein mlissen, wird vor allem in Bezug auf die Physik diskutiert. Bis in das 20. 
Jahrhundert hinein waren alle Gesetze der Physik deterministisch, beispielsweise die 
Gesetze der klassischen Mechanik 344 und der Relativitatstheorie Einsteins 345 . 

Hinter diesen deterministischen Gesetzen steht die Vorstellung einer 
deterministischen Grundstruktur der Welt. Es wird angenommen, dass die Natur 
tatsachlich mit strengen Ursache-Wirkungs-Zusammenhangen aufgebaut ist: Wenn 
bestimmte Bedingungen erfiillt sind, treten bestimmte Konsequenzen unweigerlich 
(„mit Naturnotwendigkeit“) ein (vgl. Kapitel 7.2.2). Daraus folgt, dass alle 
Ereignisse in dieser Welt eindeutig vorausbestimmt waren. Auch Menschen hatten 
damit keine Handlungs- und Entscheidungsfreiheit. 

Dass uns die Welt sowohl im Alltag wie im wissenschaftlichen Labor nicht- 
deterministisch erscheint, wird auf die Beschranktheit der menschlichen Erkenntnis- 
moglichkeiten zuriickgefuhrt: Wir kennen weder alle komplexen gesetzmaBigen 
Zusammenhange noch alle relevanten Einflussbedingungen. Die deterministisch 
formulierten Gesetzesannahmen der Wissenschaften sind danach Vereinfachungen 
und Idealisierungen, die uneingeschrankt nur in vollstandig bekannten und 
abgeschlossenen Systemen gelten. In realen Untersuchungssituationen werden die 
deterministischen Ursache-Wirkungs-Zusammenhange dagegen immer durch die 
Wirkung nicht kontrollierter Storfaktoren iiberlagert. 346 

In der Physik wurde das streng deterministische Weltbild durch die Quanten- 
mechanik erschiittert, die von einer objektiv unbestimmten (probabilistischen) 
Grundstruktur der Welt ausgeht. 

0 Nach den Gesetzen der Quantenmechanik kann nicht die exakte Position eines Teilchens 
bestimmt werden, sondern nur die Wahrscheinlichkeit des Auftretens an einer bestimmten 
Raum-Zeit-Stelle. 347 

Insbesondere Albert Einstein konnte sich mit diesem Indeterminismus nie 
anfreunden. 348 Trotzdem ist die Wahrscheinlichkeitsinterpretation quanten-physi- 



343 

344 

345 

346 



347 



348 



siehe dazu ausfiihrlicher Stegmtiller (1983, S. 559-582) 

z.B. das Gravitationsgesetz (7-1) und das sog. Zweite Newtonsche Gesetz („Kraft ist 
gleich Masse mal Beschleunigung“) 

zur Einfuhrung siehe Russell (1969), Sexl (1983) und Breuer (1996) 

Die praktische Vorhersage kiinftiger Zustande komplexer Systeme kann auch an der 
beschrankten Erfassbarkeit gegenwartiger Zustande scheitern. Wie durch die 
Chaostheorie gezeigt wird, konnen minimale Unterschiede zu vollig andersartigen 
Verlaufen fiihren (Barton, 1994; Hoger, 1992). 

Breuer (1996, S. 359), Carnap (1986, S. 279-289), MittelstraB (1995c, S. 429-436). Die 
probabilistische Interpretation der Quantentheorie wurde von Max Born initiiert und von 
Heisenberg und Bohr zur „Kopenhagener Deutung“ weiterentwickelt. 

„Gott wiirfelt nicht“ (Folsing, 1993, S. 644-673; MittelstraB, 1995b, S. 469) 
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kalischer Gesetze allgemein anerkannt. Eine theoretische Fundierung erhielt sie 
durch Heisenbergs Unscharferelation. 

0 Wahrend in der klassischen Mechanik alle GroBen prinzipiell beliebig genau gemessen 
werden konnen, gibt es nach der quantenmechanischen Unscharferelation eine definitiv 
nicht iiberschreitbare Grenze der Genauigkeit, mit der Ort und Impuls eines Teilchens 
gleichzeitig bestimmt werden konnen. 

Damit ist die Vollstandigkeit und Prazision der Messung von Ursachenfaktoren 
prinzipiell begrenzt. Probabilistische Theorien sind offenbar das Beste, was die 
physikalische Wissenschaft erreichen kann. 



7.1.5.2 Psychologische GesetzmalMgkeiten 

Einige psychologische Gesetze und Theorien sind explizit probabilistisch formuliert, 
insbesondere in der mathematischen Psychologie. 349 

0 Theorien des Paarassoziations- und Konzeptlernens nehmen an, dass jeder Reiz oder jede 

Reizkomponente in jedem Lemdurchgang mit einer bestimmten Wahrscheinlichkeit mit 

der richtigen Antwort verbunden wird und dadurch der beobachtbare allmahliche 

Lernfortschritt entsteht. 350 Nach der Theorie des Konzepterwerbs durch sukzessive 

Hypothesenpriifung beispielsweise ergibt sich die Wahrscheinlichkeit p n einer richtigen 

351 

Antwort im Durchgang n im einfachsten Fall wie folgt: 

(7-8) p n =1 -0,5(1 -0,5 c) 11 - 1 . 

Ein groBe Gruppe von psychologischen Theorien und Gesetzen ist zwar nicht 
explizit probabilistisch formuliert, bezieht sich aber auf Tendenzen oder 
Dispositionen zu bestimmten Verhaltensweisen. 

0 Nach der Lern- und Motivationstheorie von Clark Hull ergibt sich aus der multiplikativen 
Verknlipfung von Habitstarke und Antriebsstarke das Reaktionspotential fur eine 
bestimmte Reaktion auf einen bestimmten Reiz. Ob eine bestimmte Reaktion tatsachlich 
ausgeftihrt wird, hangt aber nicht nur vom Reaktionspotential ab, sondern auch von einer 

352 

zufallig variierenden Schwelle. 

0 Nach dem Risiko-Wahl-Modell von Atkinson bestimmen die Hohe des Erfolgs- und des 
Misserfolgsmotivs sowie die subjektive Erfolgswahrscheinlichkeit die resultierende 
Tendenz , sich einer Leistungsaufgabe zuzuwenden. 353 

Die meisten Theoriendarstellungen und Lehrbticher der Psychologie scheinen am 
deterministischen Weltbild der klassischen Physik orientiert zu sein. Auf 



349 

350 

351 

352 

353 



Uberblicke: Coombs, Dawes & Tversky (1975), Restle & Greeno (1970), Sydow & 
Petzold (1981), Sixtl (1996) 

Tack (1976), Wender (1990), Cheng (1997) 

Bower & Trabasso (1964), Deppe (1977, S. 111-120). Dabei ist c die Wahrscheinlich- 
keit fur die Auswahl der richtigen Hypothese, die aus den Daten geschatzt werden muss. 
Bower & Hilgard (1983, S. 148) 

Heckhausen (1989, S. 176) 
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probabilistische Konzepte wird zwar bei der wahrscheinlichkeitstheoretischen 
Bewertung und „Absicherung“ der empirischen Ergebnisse durch Signifikanztests 
zuriickgegriffen, die Gesetzesannahmen sind aber deterministisch formuliert: 

0 Thorndikes Law of Effekt: „Unter verschiedenen Reaktionen, die auf dieselbe Situation 
hin ausgefiihrt werden, werden - unter sonst gleichen Bedingungen - diejenigen starker 
mit der Situation verkntipft, die von einem ... befriedigenden Zustand begleitet oder 
innerhalb kurzer Zeit gefolgt werden ,..“. 354 

0 die Grundannahme von Festingers Dissonanztheorie: „Die Starke des Drucks zur 
Dissonanzreduktion ist eine Funktion der Starke der Dissonanz“. 355 
0 die Annahme zur Veranderung der Starke einer Produktion in Andersons Kognitions- 
theorie ACT*: „That strength increases one unit with every successful application ,..“. 356 

Bei naherer Betrachtung wird aber deutlich, dass psychologische Gesetzesannahmen 
tiberwiegend probabilistisch gemeint und zu interpretieren sind, denn viele Autoren 
drticken aus, dass die postulierten Zusammenhange nur tendenziell bestehen sollen 
oder dass bestimmte Ereignisse eintreten konnen, aber nicht miissen. 

0 Festinger formuliert seine Grundannahmen zwar deterministisch, nach seinen spezielleren 
Annahmen zur Entstehung und Reduktion der Dissonanz sind die von der Theorie 
vorhergesagten Sachverhalte „zumindest dann und wann“ zu beobachten. 357 

Bei derartigen Formulierungen ist allerdings nicht eindeutig zu entscheiden, ob die 
probabilistischen Formulierungen eine nicht-deterministische Realitat abbilden 
sollen oder nur eine Antwort auf die Fehlerbehaftetheit von Beobachtungen und 
Daten sind. 

Implizit weit verbreitet zu sein scheint die folgende Auffassung: Den betrachteten 
Sachverhalten liegen eigentlich deterministische Gesetze zugrunde. Diese konnen 
aber nicht erkannt werden, weil alle Beobachtungen von vielen Variablen beeinflusst 
werden, von denen wir jeweils nur einige identifizieren konnen. 

9 Zwischen der Leistungsmotivation und dem tatsachlichen Erfolg in Leistungssituationen 

besteht allenfalls ein tendenzieller oder probabilistischer Zusammenhang, da Schulnoten 
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und andere ErfolgsmaGe von einer Vielzahl von anderen Ursachen abhangig sind. 

Wenn wir die anderen Faktoren nicht erfassen oder kontrollieren konnen, erscheint 

• • 

uns ihre Wirkung als Zufallsvariation. Uberdies gelten alle Ursache-Wirkungs- 
Zusammenhange nur flir den Fall vollstandig isolierter und kontrollierter 
Bedingungen, die wir aber bestenfalls approximativ herstellen konnen (siehe Kapitel 
14). Damit konnen sich die eigentlich deterministischen Zusammenhange nur als 
probabilistische Zusammenhange manifestieren. 



354 

355 

356 

357 

358 



Bower & Hilgard (1983, S. 45) 

Festinger (1978) 

Anderson (1983, S. 22) 

Festinger (1978, S. 35, 103), sozialwissenschaftliche Beispiele: Opp (1976, S. 134-139) 
Weiner (1988, S. 151) 
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Insgesamt sollte in der Psychologie viel starker explizit und systematisch iiberlegt 
werden, ob der betrachtete Gegenstandsbereich eine deterministische oder eine 
probabilistische Grundstruktur hat und ob Gesetzesannahmen deterministisch oder 
probabilistisch formuliert werden sollen. Dadurch wlirde klarer verstandlich, was mit 
den psychologischen Theorien und Annahmen eigentlich gemeint ist. 



7.2 Kausalitat 

Im Alltag werden die Begriffe Kausalitat, Ursache und Wirkung explizit gar nicht so 
haufig benutzt. Dennoch machen wir standig Aussagen liber Ursachen und ihre 

OCQ 

Wirkungen. Immer wenn wir uns oder anderen eine „Warum?“-Frage stellen, 
erwarten wir als Antwort eine Kausalaussage, das heiBt eine Aussage liber 
(mogliche) Ursachen fiir den betrachteten Sachverhalt. Jede dieser Kausalaussagen 
stellt einen Versuch dar, das Zustandekommen dieses Sachverhalts zu erklaren. 
Erklarung und Kausalitat sind also eng miteinander verbunden. 

In diesem Kapitel sollen einige fiir die Psychologie wichtige Explikationen der 
Begriffe der Ursache, der Wirkung und der Kausalitat dargestellt werden. 

Kausalitat setzt eine bestimmte zeitliche Reihenfolge voraus. Wenn das Ereignis 
U zeitlich vor dem Ereignis V eingetreten ist, kann U die Ursache fiir V sein, V kann 
aber nicht die Ursache fiir U sein. Wenn die Ereignisse U und V vollig zeitgleich 
eintreten, kann zwischen ihnen keine kausale Beziehung bestehen. Sukzessions- 
gesetze konnen also Kausalgesetze sein, Koexistenzgesetze nicht. 

7.2.1 Singulare und generelle Kausalaussagen 

Sprachlich gibt es viele Moglichkeiten, Kausalaussagen zu formulieren, am 
direktesten sind Nebensatze, die durch „da“, „weil“ oder „denn“ eingeleitet werden. 

0 Da Frau Meier als alteste von vier Geschwistern aufgewachsen ist, hat sie schon friih 
gelernt, Verantwortung zu iibernehmen. 

0 Warum ist Herr Muller in den letzten Monaten so haufig krank? - Wahrscheinlich ist er 
durch seine Arbeit vollig iiberfordert. 

0 Die Konzentrationsschwierigkeiten der Kinder konnen eine Folge ihres haufigen 
Fernsehkonsums sein. 

Bisher haben wir singulare Kausalaussagen betrachtet, das heiBt Aussagen iiber 
mogliche Ursachen von einzelnen Sachverhalten. Davon zu unterscheiden sind 



Weiner (1988), Moller (1997) 

360 Die folgenden Darstellungen beruhen vor allem auf Stegmiiller (1983, S. 501-638) und 
Speck (1980, S. 318-327) sowie auf Groeben & Westmeyer (1975, S. 76-106), Carnap 
(1986, S. 187-222) und Holland (1986). Wichtige Arbeiten zur Kausalitat sind bei Sosa 
& Tooley (1993) abgedruckt. Verschiedene philosophische und psychologische Ana- 
lysen der Kausalitat stellt White (1990) kurz dar. 
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Aussagen liber generelle Ursache-Wirkungs-Zusammenhange. Sie werden als 
Kausalgesetze bezeichnet. Sprachlich werden sie meist (aber nicht immer) in „Wenn- 
dann“- oder „Je-desto“-Satzen formuliert. 

0 „Wenn der Austibung eines bestimmten Verhaltens ... immer die Vergabe von Nahrung 

361 

folgt, dann tritt es pro Zeiteinheit haufiger als vor dem Versuch auf.“ 

0 „Unter sonst gleichen Bedingungen ist bei Motorneuronen die Erregbarkeit um so groBer, 
je kleiner das Neuron ist.“ 362 

0 „Veranderte Anforderungen in der Produktion, beispielsweise Flexible Fertigungssysteme 
..., ftihren dazu, dass sich Anforderungen an Qualifikationen verandern.“ 363 

Von den singularen Kausalaussagen und den allgemeinen Kausalgesetzen unbedingt 
zu unterscheiden ist das allgemeine Kausalitatsprinzip. Es besteht in der Annahme, 
dass jedes Ereignis und jeder Zustand eine wohlbestimmte Ursache hat. Viele Natur- 
wissenschaftler hatten dieses Prinzip des universellen Determinismus als heuristische 
Grundlage ihrer Arbeit akzeptiert: Es gab der wissenschaftlichen Suche nach 
allgemeinen Kausalgesetzen und singularen Kausalerklarungen eine Rechtfertigung. 
Seit Entwicklung der Quantentheorie ist es jedoch zweifelhaft, ob das Determinis- 
musprinzip auch im subatomaren Bereich gilt (vgl. Kapitel 7. 1.5.1). 

7.2.2 Kausalitat und Notwendigkeit 

Wie wir im Kapitel 7.1 gesehen haben, ist ein einfaches wissenschaftliches Gesetz 
sprachlich als Konditionalaussage („Wenn U, dann V“) und logisch als 
allquantifizierte Implikation formuliert: Vx: U(x) — > V(x). Damit kann sowohl eine 
empirische RegelmaBigkeit als auch eine Kausalbeziehung beschrieben werden. 

Ein Kausalgesetz ist aber auf jeden Fall mehr als eine empirische RegelmaBigkeit. 
Die meisten Versuche, dieses Mehr zu spezifizieren, orientieren sich an den 
Vorstellungen der klassischen Physik: Die Begriffe der Ursache und der Kausalitat 
beinhalten danach immer den Begriff der Notwendigkeit und die Vorstellung einer 
Kraft oder einer Energieubertragung : Ein Ereignis u ist im materiellen Sinn nur dann 
die Ursache eines Ereignisses v, wenn das Ereignis u das Ereignis v tatsachlich 
hervorbringt, d.h. wenn v zwangslaufig auf u folgen muss. Dies ist dann der Fall, 
wenn Energie von u auf v iibertragen wird. 365 

Am einfachsten lasst sich dieser materielle Begriff der Kausalitat anhand von 
Beispielen verdeutlichen: 
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362 

363 

364 



365 



Bredenkamp (1998, S. 17) 

Birbaumer & Schmidt (1999, S. 130) 

Zimbardo & Gerrig (1999, S. 732) 

Ubertragt man dieses Determinismusprinzip auf psychische Ereignisse und Zustande, 
sind auch Gedanken, Gefuhle und Empfindungen vollstandig durch vorausgegangene 
physische oder psychische Zustande bestimmt. Die von uns empfundene Widens- oder 
Entscheidungsfreiheit kann dann nur eine Illusion sein (siehe oben Seite 47). 

Kistler (1998) 
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0 Eine Kugel liegt ruhig und frei beweglich auf dem Tisch. Sie wird mit einem Stock 
kraftig angestoBen und rollt dann weg. Der StoG mit dem Stock ist dann ohne Zweifel 
eine Ursache des Wegrollens der Kugel, denn bei einem hinreichend starker StoG wird so 
viel Energie auf die Kugel ubertragen, dass sie notwendigerweise wegrollt. 

0 Ein Auto steht ruhig und frei beweglich vor einer Ampel. Die Ampel springt von Rot auf 
Grim, und das Auto fahrt weg. Das Grim der Ampel ist nicht die materielle Ursache fur 
das Wegfahren: Es ubertragt keine Energie, es bringt das Wegfahren nicht tatsachlich 
hervor, es besteht keine Zwangslaufigkeit oder Notwendigkeit. Trotzdem kann zwischen 
Ampelgriin und Autowegfahren eine empirische RegelmaGigkeit bestehen, die durch 
einen Konditionalsatz oder eine Implikation beschrieben werden kann. 

Der wesentliche Einwand gegen die materialistische Kausalitatsauffassung geht 
bereits auf David Hume zuriick: Auch materielle kausale Beziehungen sind nicht 
direkt beobachtbar. Bei zwei Ereignissen u und v ist deren zeitliche Abfolge 
unmittelbar zu beobachten. Beobachtbar ist gegebenenfalls auch, dass die beiden 
Ereignisse regelmaBig miteinander verbunden sind. Die Aussage, dass das Ereignis u 
die Ursache des Ereignisses v ist, ist dagegen immer eine Konstruktion, eine 
Behauptung, die ausschlieBlich in unserer Vorstellung hervorgebracht wird. 

Wird fur zwei aufeinanderfolgende Ereignisse u und v ein Ursache-Wirkungs- 
Zusammenhang angenommen, so wird nach Hume unterstellt, dass es eine regel- 
maBige, gesetzmaBige Verknupfung zwischen Ereignissen der Art U und Ereignissen 
der Art V gibt. Wenn wir spezielle Ereignisabfolgen kausal interpretieren, subsu- 
mieren wir sie also unter hypothetische Gesetze oder Theorien. 366 Dies ist sowohl bei 
materiellen als auch bei nicht-materiellen Prozessen moglich. 

Die Begriffe der Kausalitat und Ursache miissen damit nicht auf materielle, 
energietibertragende Ereignisse beschrankt werden, sondern konnen in einem sehr 

Q/'n 

weiteren Sinn gebraucht werden. Daher kann in alien Wissenschaftszweigen 
danach gestrebt werden, Gesetzesannahmen liber Ursache-Wirkungs-Zusammen- 
hange aufzustellen und zu tiberprtifen. 

0 Das Einfuhlungsvermogen des Therapeuten wird als Ursache fur die positivere 
Befindlichkeit des Patienten bezeichnet, die Vorurteile als Ursache fur die Gewalt, das 
angenehme Betriebsklima als Ursache fur die geringen Fehlzeiten, die hohen 
Staatsausgaben als Ursache fur die Inflation usw. 

7.2.3 Bedingungsanalyse der Kausalitat 

Die Begriffe der Kausalitat und der Ursache in ihrem weiten, nicht auf materielle, 
energietibertragende Systeme beschrankten Sinn, sollen im folgenden naher 
expliziert werden. Dazu greifen wir auf die aussagenlogischen Begriffe der 



Stegmtiller (1983, S. 513), Cheng (1997, S. 369-370). Im Folgenden wird der Ein- 
fachheit halber nicht mehr zwischen Einzelereignissen und Ereigniskategorien unter- 
schieden, sondern Kausalitat nur noch fur Sachverhaltstypen U und V betrachtet. 

Bunge (1997, S. 419), Rueger (1998) 
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notwendigen und hinreichenden Bedingung zuriick: Besteht eine Implikation A — > B, 
ist A eine hinreichende Bedingung fur B und B ist eine notwendige Bedingung fur A 
(siehe Kapitel 3.2.3). 

Wie wir gesehen haben, entspricht ein wissenschaftliches Gesetz allgemein einer 
Implikation, die fur alle Elemente einer unendlichen Menge giiltig sein soil: 

(7-3) Vx: U(x) V(x). 

Trotzdem ware es voreilig, den Begriff der Ursache mit dem Begriff der 
hinreichenden Bedingung gleichzusetzen: In Wissenschaft und Alltag werden 
regelmaBig Sachverhalte als Ursachen bezeichnet, die tatsachlich die jeweilige 
Wirkung gar nicht allein hervorbringen konnen, die also keineswegs hinreichend fur 
die jeweilige Wirkung sind. Eine wesentliche Eigenschaft von Ursachen scheint 
vielmehr zu sein, dass sie in gewissem Sinne notwendig sind, dass ohne sie die 
Wirkung also nicht eintritt. 

Inus-Bedingungen 

Eine differenzierte Explikation des Ursachenbegriffs besteht darin, eine Ursache als 
eine Inus-Bedingung fur ein Ereignis zu bezeichnen. 368 Eine Ursache muss danach 
vier Bedingungen erfiillen, deren Anfangsbuchstaben im Englischen die Abkiirzung 
inns ergeben: Eine Ursache ist an insufficient but necessary part of an unnecessary 
but sufficient condition. Etwas genauer ausgefuhrt bedeutet dies: 

(7-9) Eine Ursache U eines Ereignisses V ist 

ein Teil einer Menge S von Bedingungen, 
der unter den vorliegenden Umstanden 

• einzeln nicht hinreichend (insufficient) 

• aber notwendig ( necessary ) ist, 
wohingegen die Gesamtbedingung S 

• nicht notwendig ( unnecessary ), aber 

• insgesamt hinreichend ( sufficient ) 
fur das Auftreten des Ereignisses V ist. 

Die Bedingungen, die zu S, aber nicht zu U gehoren, bezeichnen wir als 
Randbedingungen R. 369 Die Bedingungen dafiir, dass U eine Ursache fur V ist, 
konnen dann kurz wie folgt zusammengefasst werden: 

• U ist notwendig, aber nicht hinreichend fur V, 

• U a R ist hinreichend, aber nicht notwendig fur V, 

• R ist nicht hinreichend fiir V. 



Mackie (1974), Stegmiiller (1983, S. 583-593), Speck (1980, S. 321), Sosa & Tooley 
(1993) 

Fassen wir U und S als Mengen auf, gilt UcS,UuR = S und S\U = R. 
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Dass mit dieser Inus-Explikation tatsachlich die wesentlichen Aspekte dessen erfasst 
werden, was wir gemeinhin unter einer Ursache verstehen, kann an einem 
alltaglichen und einem psychologischen Beispiel deutlich gemacht werden. 

0 Ein Experte der Kriminalpolizei hat den Brand eines Hauses aufzuklaren und kommt auf 

Grund seiner Unter suchungen zu dem Ergebnis, dass ein Kurzschluss die Ursache flir das 

Feuer gewesen ist. Dies bedeutet: 

- Der Kurzschluss ist einzeln nicht hinreichend flir das Feuer, denn ohne gentigend 
Sauerstoff und brennbares Material in der Nahe des Kurzschlusses oder mit einer 
guten Sprinkleranlage im Haus hatte der Kurzschluss nicht zum Brand gefiihrt. 

- Der Kurzschluss und die anderen vorliegenden Bedingungen waren zusammen nicht 
notwendig , denn der Brand hatte auch durch eine andere Ursache (z.B. Brandstiftung) 
ausgelost werden konnen. 

- Offensichtlich war der Kurzschluss aber mit den tibrigen Bedingungen zusammen 
hinreichend flir den Brand, denn ansonsten hatte es ja nicht gebrannt. 

- Unter den gegebenen Umstanden war, und dies ist der entscheidende Kern der 
Kausalaussage des Brandexperten, der Kurzschluss einzeln notwendig , denn bei 
Konstanz alter anderen Bedingungen hatte es ohne den Kurzschluss nicht gebrannt. 

0 Eine Psychologin ist zu der Auffassung gelangt, dass der langjahrige Heimaufenthalt von 

Jens die Ursache flir seine wiederholte Straffalligkeit ist. Dies bedeutet: 

- Der Heimaufenthalt ist einzeln nicht hinreichend , denn viele Heimkinder werden nicht 
kriminell (z.B. weil sich die Heimerziehung positiv auswirkt). 

- Der Heimaufenthalt und die anderen Erfahrungen und Eigenschaften von Jens waren 
zusammen nicht notwendig , denn die Straffalligkeit hatte auch bei ganz anderen 
Lebensumstanden auftreten konnen. 

- Bei Jens waren offensichtlich der Heimaufenthalt und die anderen Bedingungen 
zusammen hinreichend flir die Straffalligkeit, denn ansonsten ware es ja nicht zur 
Straffalligkeit gekommen. 

- Unter den gegebenen Umstanden war nach Auffassung der Psychologin der 
Heimaufenthalt einzeln notwendig , d.h. bei Konstanz aller anderen Bedingungen ware 
Jens nicht kriminell geworden. 

Sowohl die Ursache U wie die sonstigen Teile R der Bedingungsmenge S konnen 
sehr komplexe Sachverhalte sein. Oft ist es moglich, sie weiter aufzuspalten und um 
Bestandteile zu bereinigen, die bei naherer Betrachtung gar nicht notwendig flir den 
zu erklarenden Sachverhalt sind. Dies fiihrt zu einer spezifischeren, sparsameren und 
damit besseren Erklarung. 

Multiple Ursachen 

Aus der Inus-Explikation (7-9) und den nachfolgenden Beispielen ergibt sich, dass 
jeder Sachverhalt V mehrere Ursachen U, Ui, U 2 ... haben kann: Jede von ihnen ist 
einzeln notwendig und zusammen mit anderen Bedingungen hinreichend flir V. 
Greifen wir eine Ursache U flir V heraus, gehoren die anderen moglichen Ursachen 
Ui, U 2 , ... zur Menge R der Randbedingungen. 
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0 Der 19jahrige Olaf prallt Samstag abend mit seinem Auto gegen einen Baum und verletzt 
sich und seine vier Mitfahrer schwer. Menschen aus unterschiedlichen Disziplinen 
nennen verschiedene Ursachen fur diesen Unfall: iiberhohte Geschwindigkeit (der 
Polizist), iibersteuernde Fahrwerkskonstruktion (der Autoingenieur), altes Kopfstein- 
pflaster (der StraBenbauer), engstehende Baume (der Automobilclub) usf. Jeder dieser 
Sachverhalte kann tatsachlich eine Ursache im Sinne der Inus-Explikation sein. Nach 
Auffassung des StraBenbauers beispielsweise ware es ohne Kopfsteinpflaster nicht zu 
dem Unfall gekommen, auch wenn alle anderen Bedingungen gleich geblieben waren 
(z.B. die hohe Geschwindigkeit und die voile Besetzung des Autos). 

Welche der notwendigen Bedingungen fiir einen zu erklarenden Sachverhalt als 
Ursache in den Vordergrund geriickt werden und welche Bedingungen damit im 
Hintergrund bleiben, ist abhangig vom Erfahrungsstand und den Zielen der 
erklarenden Person sowie von der Deutlichkeit, mit der verschiedene Merkmale in 
der jeweiligen Situation hervortreten. Bevorzugt als Ursachen herausgehoben werden 
auBergewohnliche Ereignisse sowie regelmaBige Korrelate des zu erklarenden 
Sachverhalts. Relativ iiberdauernde oder gewohnliche Merkmale der Situation bilden 
hingegen eher die Rand- oder ermoglichenden Bedingungen , 370 

0 Der Autounfall wird eher mit der ungewohnlich hohen Geschwindigkeit als mit den seit 
jeher eng stehenden Baumen erklart, obwohl diese nach der Inus-Bedingung auch als 
Ursache bezeichnet werden konnen. In anderen Kontexten (z.B. bei einem Unfall in einer 
fast baumlosen Region) konnen sie aber durchaus als Ursache herausgehoben werden. 

0 Der Kurzschluss hatte nicht zum Feuer gefiihrt, wenn das Haus in sauerstofffreier 
Umgebung gestanden hatte. Trotzdem wird der Sauerstoff nicht als Ursache genannt, weil 
er unter alien realistischen Umstanden vorhanden ist. Im Weltraum kann das 
Vorhandensein von Sauerstoff aber eine wichtige Ursache fur einen Brand sein. 

Auch wenn die Inus-Explikation keine hinreichenden Bedingungen fiir die 
Identifikation einer Ursache angibt, ist sie doch die gegenwartig bestmogliche 
Explikation der Begriffe der Ursache und der Kausalitat. Dies bedeutet natiirlich 
nicht, dass die Worter Ursache und Kausalitat immer in genau diesem Sinn 
verwendet werden. Wie jede Explikation ist auch die Inus-Explikation des 
Ursachenbegriffs eine Idealisierung und Verbesserung des iiblichen Wortgebrauchs, 
die das Verstandnis und die Verstandigung verbessern soil. 

0 Wenn eine Psychologin den Heimaufenthalt als Ursache fiir die Straffalligkeit bezeichnet, 
mochte sie vielleicht nur ausdriicken, dass Heimaufenthalt und Straffalligkeit insofern 
etwas miteinander zu tun haben, als Heimkinder haufiger kriminell werden als andere 
Kinder. Sie muss sich dann aber vorhalten lassen, dass sie den Ursachenbegriff so 
verwendet, dass sie moglicherweise von ihren Gesprachspartnern missverstanden wird. 



370 



Cheng & Novick (1992) 
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7.2.4 Ceteris-paribus-Bedingungen 

Wie bei den vorangehenden Erlauterungen deutlich geworden ist, muss bei einer 
Inus-Explikation stets eine Annahme iiber die Konstanz aller anderen relevanten 
Bedingungen gemacht werden. 

Zu diesen Bedingungen, die konstant bleiben sollen, gehoren erstens andere 
mogliche Ursachen fur den interessierenden Sachverhalt V und zweitens die Rand- 
bedingungen, unter denen das Ereignis U zu einer Ursache fur V werden kann. 371 
Zum ersten ist U nur dann einzeln notwendig fur V, wenn die Bedingungen insofern 
konstant bleiben, dass keine anderen moglichen Sachverhalte X, Y, ... vorliegen, die 
auch unabhangig von U den Sachverhalt V hervorrufen konnen. Zum zweiten ist U 
mit den gegebenen Bedingungen zusammen hinreichend fur V, aber nicht unbedingt 
unter veranderten Randbedingungen. 

0 Der Heimaufenthalt ist nur unter den gegebenen Umstanden einzeln notwendig und 
zusammen mit ihnen hinreichend fur die Straffalligkeit. Erstens hatten ohne einen 
Heimaufenthalt auch andere Umstande zur Straffalligkeit fiihren konnen (z.B. Anschluss 
an eine Bande in der Nachbarschaft). Zweitens hatten andere Umstande (z.B. Betreuung 
durch eine engagierte Psychologin) dazu fiihren konnen, dass Jens trotz des Heim- 
aufenthalts nicht straffallig wird. 

Derartige Annahmen iiber die Konstanz aller anderen relevanten Faktoren und 
Umstande werden als Ceteris-paribus-Bedingungen bezeichnet. 

Ceteris-paribus-Bedingungen sind ein notwendiger Bestandteil aller Kausal- 
gesetze, meist werden sie aber nicht explizit formuliert. 372 Manifest werden sie bei 
alien experimentellen Priifungen von wissenschaftlichen Kausalannahmen, denn bei 
jedem Experiment wird versucht, moglichst alle nicht primar interessierenden 
Bedingungen konstant zu halten oder nur unsystematisch variieren zu lassen. 

Da die Annahme der Gleichheit oder Unsystematik aller anderen relevanten 
Bedingungen ein wesentlicher Bestandteil aller Kausalaussagen ist, konnte man bei 
wissenschaftlichen Gesetzesannahmen stets explizit ein ceteris paribus einfligen. In 
die quantorenlogische Formulierung (7-3) wird deshalb ein Index cp eingefiigt: 

(7-10) Vx: U(x) cp -> V(x). 

Aufgrund der Ceteris-paribus-Bedingungen sind wissenschaftliche Kausalgesetze 
immer unvollstandig : Sie konzentrieren sich auf eine Ursache (oder auf eine 
begrenzte Menge von Ursachen) fur den interessierenden Sachverhalt, wahrend alle 
anderen moglichen Einflussfaktoren dadurch ausgeblendet werden, dass sie als 
konstant oder unsystematisch angenommen werden. 



Siemer (1993) 

Johansson (1980), Secord (1986), Macnamara, Govitrikar & Doan (1988), Salmon 
(1989), Fodor (1991), Schiffer (1991), Pietroski (1994), Wallach & Wallach (1994), 
Cheng (1997), zur Kritik: Mott (1992) 
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Wissenschaftliche Kausalgesetze beziehen sich damit auf vollstandig kontrollier- 
bare und gegeniiber alien anderen moglichen Einflussfaktoren abgeschlossene 
Situationen. Sie beziehen sich also auf ideale Systeme, die in der natlirlichen und 
sozialen Umwelt gewohnlich nicht vorkommen. Sie konnen vielmehr hochstens in 
Experimentallabors approximativ hergestellt werden. Die Labors der verschiedenen 
Wissenschaftsbereiche unterscheiden sich dabei vor allem dadurch, welche 
wesentlichen anderen Einflussfaktoren kontrolliert werden miissen. Im klassischen 
naturwissenschaftlichen Labor werden vor allem storende physikalische Variablen 
kontrolliert. Es werden Luftdruck und Temperatur konstant gehalten, Einstrahlungen 
von auBen abgeschirmt usw. In einem sozialpsychologischen Labor beispielsweise 
kommt es eher auf die Kontrolle von Einfliissen durch Versuchsleiter, voran- 
gegangener Lebensereignisse, momentaner Stimmungen usw. an. 

Bei der experimentellen Priifung von Kausalannahmen muss allerdings nicht die 
absolute Konstanz aller anderen moglicherweise relevanten Variablen gefordert 
werden. Vielmehr miissen nur die Verteilungen dieser anderen Variablen unter alien 
Auspragungen des interessierenden Faktors konstant bleiben, d.h. die nicht- 
interessierende Variablen miissen von ihm unabhangig sein. 

7.2.5 Kontrafaktische und manipulative Auffassung der Kausalitat 

Die Inus-Explikation der Kausalitat beinhaltet zwei altere und einfachere 
Explikationen der Begriffe der Ursache und der Kausalitat: die kontrafaktische und 
die manipulative Sichtweise der Kausalitat. 

Aus der Inus-Explikation und den erlauternden Beispielen wird deutlich, dass jede 
Kausalaussage eine sog. kontrafaktische Aussage beinhaltet: Die kausale Aussage „U 
ist Ursache von V“ impliziert die Aussage „Wenn U nicht stattgefunden hatte, hatte 

074 

unter den gegebenen Umstanden auch V nicht stattgefunden“.' 

U als die Ursache von V zu betrachten, bedeutet also auch, dass man das Eintreten 
von V unter den gegebenen Umstanden dadurch hatte verhindern konnen, dass man 
(bei Konstanz aller anderen Bedingungen) das Eintreten von U verhindert hatte. Dies 
ist die manipulative oder interventionistische Sichtweise der Kausalitat. 375 

Die kontrafaktischen und manipulativen Interpretationen der Kausalitat zeigen, 
dass sich eine Kausalaussage nicht nur auf die einfachen Ereignisse U und V bezieht, 
sondern auch auf das Nicht-Eintreten dieser Ereignisse, d.h. — iU und — 1 V. Wir 
konnen U und V deshalb als Variablen betrachten. U ist die unabhangige Variable , 
V die abhangige Variable. Sie haben jeweils mindestens zwei Auspragungen (U und 
— iU bzw. V und — TV), konnen aber auch unendlich viele Auspragungen haben. 



Rubin (1974, 1990), Steyer (1983, 1994, S. 669-670), Holland (1986) 

374 

Diese Aussage ist kontrafaktisch, weil U ja tatsachlich stattgefunden hat. 

375 Blalock (1971), Stegmiiller (1983, S. 600) 
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0 Bei eine Aussage iiber eine kausale Verbindung zwischen Heimerziehung und 
Straffalligkeit nehmen U und V im einfachsten Fall jeweils zwei Auspragungen an: 
Heimerziehung vs. keine Heimerziehung bzw. Straffalligkeit vs. keine Straffalligkeit. Bei 
einer differenzierteren Analyse konnen U und V jeweils mehr als zwei Auspragungen 
haben. Beispielsweise kann U die Dauer des Heimaufenthalts in Monaten bezeichnen und 
V die Zahl der richterlichen Verurteilungen oder MaBnahmen. 

Betrachten wir U und V als Variablen, beziehen sich Kausalaussagen auf 
Veranderungen oder Unterschiede auf diesen Variablen. 376 Wir bezeichnen sie als 
dU bzw. dV (d steht fur Differenz). Die kurze Aussage „U ist Ursache von V“ 
bedeutet also, dass Veranderungen oder Unterschiede auf der Variablen U die 
Ursache von Veranderungen oder Unterschieden auf der Variablen V sind: 

• Wenn dU eintritt und wenn alle anderen Bedingungen gleich bleiben, dann tritt 
dV ein. 

Aus den bisherigen Ausdriicken (7-3) und (7-10) erhalten wir damit die folgende 
vollstandige Formulierung eines Kausalgesetzes: 

(7-1 1) Vx: dU(x) cp -» dV(x). 

• • 

Uberpriifung von Kausalhypothesen 

Zur Uberpriifung von Kausalaussagen muss man die interessierenden Objekte unter 
mindestens zwei Bedingungen beobachten. Sie diirfen sich nur dadurch 
unterscheiden, dass in der einen die mogliche Ursache realisiert ist, in der anderen 
aber nicht. Alle anderen Bedingungen miissen so weit wie moglich konstant bleiben. 
Dieses Ziel kann im Prinzip auf dreierlei Weise angestrebt werden. 377 

• In Physik und anderen klassischen Naturwissenschaften konnen oft praktisch 
identische Substanzen oder Objekte hergestellt und unter verschiedenen 
Bedingungen untersucht werden. Haufig bleiben Objekte im Experiment auch so 
unverandert, dass dasselbe Objekt unter alien Bedingungen untersucht werden 
kann. 

• Beides ist in der Regel nicht moglich ist, wenn Tiere, Menschen oder Gruppen 
untersucht werden: Die Erfahrungen, die sie unter einer Bedingung machen, 
lassen sich weder vernachlassigen noch riickgangig machen. Deshalb miissen 
psychologische Gesetzesannahmen dadurch iiberpriift werden, dass man unter den 
interessierenden Bedingungen jeweils mehrere Objekte untersucht und die 

070 

aggregierten Ergebnisse betrachtet. Um alle Merkmalsauspragungen 
tendenziell konstant zu halten, werden diese den Bedingungen zufallig zugeordnet 
(. Randomisierung , siehe Kapitel 14.3). 



376 

377 

378 



Siemer (1993, S. 730) 

Cook & Campbell (1979), Holland (1993), Rubin (1974) 

Bakan (1966), Bredenkamp (1972), Gadenne (1976), Iseler (1997), Sohn (1999) 
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• 1st keine zufallige Zuordnung moglich, konnen bekannte Unterschiede zwischen 
den Untersuchungseinheiten in den verschiedenen Bedingungen statistisch 
herausgerechnet werden ( Auspartialisierung ). Diese statistische Konstanthaltung 
fiihrt in der Regel zu einer schwacheren Priifung der Kausalhypothese als die 
experimentelle Randomisierung (siehe unten Kapitel 13 und 14). 

7.2.6 Probabilistische Kausalitat 

Orientiert am deterministischen Weltbild der klassischen Physik (siehe Kapitel 
7. 1.5.1) wurden bis in die jlingste Zeit hinein in Philosophic und Naturwissen- 
schaften nur streng deterministische Zusammenhange als kausale Zusammenhange 
bezeichnet: eine Ursache musste ihre Wirkung definitionsgemaB stets und mit 
Notwendigkeit nach sich ziehen (siehe Kapitel 7.2.2). Probabilistische Gesetze 
konnten danach keine kausalen Gesetze sein. 379 

Da die Quantenphysik mit ihren probabilistischen Gesetzen seit Jahrzehnten 
wohletabliert ist und da auch in anderen Wissenschaftsbereichen viele oder gar alle 
Gesetze probabilistisch zu sein scheinen, hat Patrick Suppes die Begriffe der 
Kausalitat und der Ursache auch fur probabilistische GesetzmaBigkeiten expliziert. 380 
Ein Ereignis U ist nach Suppes eine mogliche Ursache fur das spatere Ereignis V, 

io 1 

wenn das Eintreten von U die Wahrscheinlichkeit fur das Eintreten von V erhoht: 
(7-12) P(V |U)>P(V). 

Offensichtlich kann nicht jede mogliche Ursache auch als tatsachliche Ursache 
bezeichnet werden. 

0 V bezeichne das Ereignis, dass ein Greifswalder Medizinstudent im 5. Semester seinen 
Antrag auf Exmatrikulation abgibt. U ist die Tatsache, dass ein Greifswalder Medizin- 
student im 5. Semester seine Wohnung kiindigt. Die Wahrscheinlichkeit fur V sei 0,20, 
die bedingte Wahrscheinlichkeit P(V I U) sei 0,75. Trotzdem wlirde niemand die 
Wohnungsktindigung als Ursache flir die Exmatrikulation bezeichnen. Wir wurden 



Stegmuller (1983, S. 526) 

380 Suppes (1970), Weiterentwicklungen und Kritik: Stegmuller (1983, S. 600-638), 
Holland (1986), Otte (1987), Sosa & Tooley (1993), Sobel (1996), Cheng (1997) 

381 

In der Terminologie von Suppes wird von einer Prima-facie-Ursache gesprochen. Alle 
Ausfuhrungen zur probabilistischen Kausalitat gelten entsprechend auch flir den Fall, 
dass U die Wahrscheinlichkeit fur V nicht erhoht, sondern verringert. Die dargestellten 
Analysen der Kausalitat konnen von einzelnen Sachverhaltstypen, die entweder 
eintreten konnen oder nicht, auch auf kontinuierliche Variablen verallgemeinert werden. 
Das Konzept der (Prima-facie-)Ursache wird dann nicht durch Vergleich von 
Wahrscheinlichkeiten, sondern als Differenz von Erwartungswerten expliziert (Holland, 
1993; Steyer, 1992). 

382 Derartige Wahrscheinlichkeiten konnen auch als Verhaltenstendenzen ( propensities ) bei 
einer einzelnen Person aufgefasst werden (siehe oben FuBnote 342 auf Seite 146). 
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vielmehr vermuten, dass es ein anderes Ereignis W gibt, das sowohl die Kundigung wie 
die Exmatrikulation verursacht hat. 

Deshalb mtissen weitere Bedingungen identifiziert werden, die notwendig sind, 
damit U tatsachlich eine Ursache fur V ist. Die wichtigste von ihnen ist das Fehlen 
anderer wirksamer Ereignisse: U ist nur dann Ursache fur V, wenn es kein weiteres 
Ereignis W gibt, das die erhohte bedingte Wahrscheinlichkeit vollstandig absorbiert, 
d.h. das allein zu dem gleichen erhohten bedingten Wahrscheinlichkeitswert ftihrt. 
Ein anderes Ereignis W absorbiert in diesem Sinne die Beziehung zwischen U und 

TOT 

V, wenn neben (7-12) auch folgendes gilt: 

(7-13) P(V IUaW) = P(V IW). 

In diesem Fall ist die bedingte Wahrscheinlichkeit fur V nicht groBer, wenn neben W 
auch U berucksichtigt wird. In W ist damit die gesamte Information tiber V 
enthalten, die auch in U enthalten ist. 384 

Tritt dieses absorbierende Ereignis W vor dem Ereignis U auf, wird U als eine 
Scheinursache von V bezeichnet. Tritt W zwischen U und V auf, ist U allenfalls eine 
indirekte Ursache von V. 

0 W sei die Tatsache, dass ein Greifswalder Medizinstudent einen Studienplatz an einer 
anderen Universitat erhalt. Gilt (7-13), d.h. ist die Wahrscheinlichkeit fur ein 
Exmatrikulation unter der Bedingung des anderen Studienplatzes gleich der 
Wahrscheinlichkeit fur eine Exmatrikulation unter der Bedingung des anderen Studien- 
platzes und der Wohnungskiindigung, ist die Wohnungskiindigung keine echte Ursache 
fur die Exmatrikulation. Ist der Studienplatzbescheid W vor der Wohnungskiindigung 
eingetroffen, ist die Wohnungskiindigung eine Scheinursache. Ist der Bescheid zwischen 
Wohnungskiindigung und Exmatrikulation eingetroffen, kann die Wohnungskiindigung 
eine indirekte Ursache fiir die Exmatrikulation sein, sie muss es aber nicht sein. 

Ein absorbierendes Ereignis W, durch das U zu einer Scheinursache oder einer 
indirekten Ursache wird, kann sich auf Grand eines anderen Ereignisses W’ wieder 
als Scheinursache oder indirekte Ursache erweisen usf. 

Um positiv zu definieren, wann im probabilistischen Fall ein Ereignis U 
tatsachlich eine direkte Ursache fur ein anderes Ereignis V ist, muss man wiederum, 
wie im deterministischen Fall, hypothetisch eine Konstanz aller anderen 
Bedingungen annehmen. Wir fassen dazu alle vor V eingetretenen Ereignisse, auBer 
U, zur Menge der Randbedingungen R zusammen. U ist nur dann eine tatsachliche 
Ursache von V, wenn die (bedingte) Wahrscheinlichkeit von V unter den gegebenen 
Bedingungen R durch Hinzunahme von U erhoht wird. 385 



Suppes (1970), Stegmiiller (1983, S. 611), andere Explikationen: Salmon (1984), 
Waldmann & Holyoak (1992, S. 225) 

384 Realitatsnaher kann man statt der exakten nur die approximative Gleichheit fordern. 

385 nach Stegmiiller (1983, S. 626), Mulaik (1986), Otte (1987, S. 53-54), Cheng & Novick 
(1992). Die Charakterisierung als Ursache setzt voraus, dass R tatsachlich alle 
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(7-14) P(V |UaR)>P(V I — iU aR). 

Dieses probabilistische Kausalitatskonzept ist eine Verallgemeinerung der 
deterministischen Kausalitat im Sinne der Inus-Explikation (7-9). Wenn wir diese 
Grundform fur Veranderungen formulieren und den notwendigen Allquantor 
hinzufligen, erhalten wir als allgemeine Form fur probabilistische Kausalgesetze: 

(7-15) Vx: P(dV(x) I dU(x) a R(x) ) > P(dV(x) I ^dU(x) a R(x) ). 

Etwas kiirzer und iibersichtlicher konnen wir auch schreiben: 

(7-16) Vx: P(dV I dU) > cp P(dV I ^dU) 

Durch den cp-Index wird ausgedrlickt, dass dU nur mit den konstanten anderen 
Bedingungen zusammen hinreichend fur die hohere Wahrscheinlichkeit von dV ist. 
Auch eine kausale Aussage im probabilistischen Sinn kann wiederum als kontra- 
faktische Aussage interpretiert werden: Die Wahrscheinlichkeit fur V hatte sich nicht 
verandert, wenn U nicht eingetreten ware und alle anderen Bedingungen gleich 
geblieben waren. 386 

7.2.7 Kausale und assoziative Gesetzesannahmen 

Nachdem wir im Kapitel 7.1 verschiedene Arten von wissenschaftlichen Gesetzen 
beschrieben und in den vorangegangen Teilen dieses Kapitels 7.2 den Begriff der 
Kausalitat naher expliziert haben, soil nunmehr die schon mehrfach erwahnte 
Unterscheidung zwischen kausalen und assoziativen Gesetzesannahmen oder 
Gesetzen zusammenfassend dargestellt werden. 

Kausalgesetze 

Kausalgesetze sind allgemeine und unerschopfliche Aussagen liber Ursache- 
Wirkungs-Zusammenhange zwischen Variablen. Als wesentliches Merkmal von 
deterministischen und probabilistischen Kausalgesetzen haben wir die (meist 
impliziten) Ceteris-paribus-Bedingungen identifiziert. Bei einem probabilistischen 
Kausalgesetz treten die konstanten Randbedingungen R in den bedingten Wahr- 
scheinlichkeiten auf. 

Wie die Formulierungen (7-11) und (7-15) zeigen, beziehen sich Kausalgesetze 
auf Zusammenhange, die bei jedem einzelnen betrachteten Objekt bestehen (sollen). 
In verschiedenen Wissenschaftsbereichen werden dabei unterschiedliche Arten von 
Objekten betrachtet, ohne dass dies in den iiblichen verbalen Formulierungen zum 
Ausdruck gebracht wird. 



wirksamen anderen Variablen umfasst. Dies ist dann der Fall, wenn es keine weitere 
Variable Z gibt, so dass P(V I U a R a Z) * P(V I U a R) oder P(V I -.U a R a Z) * 
P(V I — iU a R) gilt (Papineau, 1989, S. 310-312). 

Barker (1999), Noordhof (1999) 
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Die meisten Gesetze der Psychologie, insbesondere die der Allgemeinen 
Psychologie und der Entwicklungspsychologie, beziehen sich auf Merkmale 
einzelner Menschen und sollen fur jeden Menschen gelten. 

0 Die direkt eingeschatzte subjektive Lautheit eines Tones ist eine Potenzfunktion des 
Schalldrucks. 387 

0 Bestandige Attribution von Erfolg auf internale und stabile Faktoren fiihrt zu einem 
starken Leistungsmotiv. 8 

Etliche Gesetze der Sozialpsychologie und der Padagogischen Psychologie hingegen 
beziehen sich auf Merkmale einzelner Gruppen und sollen fur jede Gruppe gelten. 

389 

0 Die Koharenz einer Gruppe steigt, wenn sie mit anderen Gruppen in Konkurrenz steht. 

An einzelnen Untersuchungsobjekten (Personen oder Gruppen) kann man ein 
psychologisches Kausalgesetze aber meist nicht valide empirisch prtifen. Eine 
ausreichende Konstanthaltung anderer moglicher Einflussvariablen ist nur moglich, 
wenn jeder Behandlungsbedingung zufallig mehrere Personen zugeordnet werden 
(siehe oben Kapitel 7.2.4 und 7.2.5 und unten Kapitel 14). 

Assoziationsgesetze 

Assoziationsgesetze beziehen sich auf regelmaBige Zusammenhange zwischen 
Variablen, unterstellen aber keine Ursache-Wirkungs-Beziehungen. Sie beinhalten 
deshalb keine Ceteris-paribus-Bedingungen, und zwar weder explizit noch implizit. 

In der Psychologie werden assoziative Gesetze meist als Annahmen iiber 
Zusammenhange zwischen Variablen iiber verschiedene Personen hinweg formuliert 
oder, was gleichbedeutend ist, als Annahmen tiber Unterschiede zwischen Gruppen 
von Personen mit verschiedenen Eigenschaften. 

0 „Bei Introvertierten erfolgen klassische Konditionierungen schneller als bei Extra- 
vertierten“ 390 ist eine Annahme iiber einen Zusammenhang zwischen einer unabhangigen 
Variablen (Introversion vs. Extraversion) und einer abhangigen Variablen (Konditionier- 
barkeit) iiber verschiedene Personen hinweg bzw. eine Annahme iiber Unterschiede in der 
Konditionierbarkeit zwischen den beiden Personengruppen der Introvertierten und 
Extravertierten. 

0 „Manner und Frauen unterscheiden sich systematisch in ihrer Personlichkeits- 
entwicklung“ 391 ist eine assoziative Gesetzesannahme iiber die Unterschiede zwischen 
zwei vorgegebenen Gruppen hinsichtlich einer (noch nicht genauer spezifizierten) Menge 
von abhangigen Variablen. 



Stevens (1975), Zimbardo & Gerrig (1999, S. 121-122) 
Weiner (1988, S. 302) 

Brown (1996, S. 552) 

Eysenck (1962), vgl. Zimbardo (1995, S. 514) 

Cohn (1991) 
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Bei diesen Assoziationsannahmen sind die Auspragungen der unabhangigen 
Variablen (Geschlecht, Beruf usw.) bei verschiedenen Personen stets vorgegeben 
(wenn sie auch mitunter nicht einfach zu bestimmen sind). Sie konnen entweder gar 
nicht oder nur in sehr engen Grenzen verandert werden. AuBerdem hangt jede dieser 
Variablen in bestimmter (wenn oft auch unbekannter) Weise mit einer (unbekannten) 
Vielzahl anderer Personlichkeitsmerkmale zusammen. 

Wenn wir eine Menge von Personen hinsichtlich einer dieser Variablen aufteilen, 
sind die resultierenden Gruppen auf keinen Fall hinsichtlich aller anderen 
Bedingungen gleich. Unterschiede auf der abhangigen Variablen V konnen deshalb 
nicht nur durch die Gruppierungsvariable U, sondern auch durch alle mit U 
zusammenhangen Personlichkeitsmerkmale verursacht sein. Ceteris-paribus- 
Bedingungen konnen damit empirisch definitiv nicht erfiillt sein. Deshalb diirfen 
eventuelle Zusammenhange zwischen einer Gruppierungsvariablen U und einer 
abhangigen Variablen V nicht als Kausalzusammenhang interpretiert werden . 392 

Unbesehen davon konnen wir auf einer theoretischen Ebene kausale Gesetzes- 
annahmen liber den Zusammenhang zwischen U und V mit Ceteris-paribus- 
Bedingung formulieren. Wir konnen diese angenommene Ursache-Wirkungs- 
Beziehung allerdings nicht direkt durch einen Gruppenvergleich empirisch 
uberpriifen . 393 

0 Die Introversion kann als Ursache fur die schnellere Konditionierbarkeit angesehen 
werden, das Geschlecht als Ursache fur die Entwicklungsunterschiede. 

Mitunter wird theoretisch explizit zwischen kausal und nicht-kausal verbundenen 
Variablen differenziert. 

0 Empirisch finden sich deutliche Zusammenhange zwischen erhohtem Blutdruck (essen- 
zieller Hypertonie) einerseits und bestimmten Personlichkeitsmerkmalen andererseits, 



392 Man konnte versucht sein, diese Konsequenz dadurch zu vermeiden, dass man die 
Personen so auswahlt, dass die Gruppen (z.B. von Mannern und Frauen) hinsichtlich 
wichtiger weiterer Variablen (z.B: Computerkenntnissen) moglichst gleich sind. Diese 
Parallelisierung ftihrt jedoch zu Untersuchungsgruppen, die anders als die 
Gesamtgruppen zusammengesetzt sind und deshalb leicht andere Gruppenunterschiede 
zeigen konnen. Wiirde man bei einer Untersuchung zu Geschlechtsunterschieden die 
Gruppen vorher parallelisieren, beispielsweise indem man zu jedem Mann in der 
Untersuchungsgruppe eine Frau mit annahernd gleicher GroBe und gleichem Gewicht in 
die Untersuchung aufnimmt, ware die weibliche Untersuchungsgruppe im Mittel groBer 
und schwerer als die gesamte weibliche Bevolkerung. 

Eine indirekte empirische Uberprtifung ist innerhalb von umfangreicheren Struktur- 
gleichungsmodellen (LISREL-Modellen) moglich (Backhaus, Erichson, Plinke & 
Weiber, 1996; Joreskog & Sorbom, 1993). Aus empirischen Korrelationen werden dabei 
unter anderem Pfadkoeffizienten geschatzt. Sie drticken den Zusammenhang zweier 
Variablen (U und V) unter Konstanthaltung aller anderen im Modell berticksichtigten 
Variablen aus und stellen damit eine (approximative) Schatzung des kausalen Einflusses 
von U auf V dar. 
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insbesondere negativer Affektivitat (Angstlichkeit, Depressivitat, ...) und Ausdrucks- 
gehemmtheit. Aus klassischer psycho-somatischer Sicht sind die Personlichkeitseigen- 
schaften (zusammen mit anderen Merkmalen und Verhaltensweisen) Ursachen fiir das 
Krankheitsbild. Fur Autoren mit somato-genetischer Ausrichtung sind sowohl die 
Personlichkeitsmerkmale wie die Hypertonie durch die gleichen physiologischen und 
morphologischen Faktoren verursacht. Die Verbindung zwischen Personlichkeits- 
eigenschaften und Erkrankung ist fiir sie also eine assoziative, keine kausale. 394 



394 



Jorgensen, Johnson, Kolodziej & Schreer (1996) 





8 Wissenschaftliche Erklarungen 



Im Alltag wird der Begriff der Erklarung in verschiedenen Bedeutungen verwendet. 

• Erklarung als Erlauterung von Funktionsweisen, Ablaufen usw. 

0 Der Psychologe erklart Patienten, wie die Verhaltenstherapie einer Platzangst ablauft. 

• Erklarung als Erlauterung der Bedeutung von Wortern 

0 Der Rechtsanwalt erklart seinem Mandanten, was eine Revision ist. 

• Erklarung als Korrektur einer falschen Meinung oder Wahrnehmung 

0 Der Journalist erklart Zuhorern, dass Frankfurt nicht die Hauptstadt von Hessen ist. 

• Erklarung als Rechtfertigung einer Verhaltensweise durch Ziele oder Grlinde 

0 Der Autofahrer erklart, dass er zu schnell fuhr, um piinktlich ins Konzert zu kommen. 

• Erklarung als Erlauterung eines Textes, eines Bildes, usw. 

0 Die Fiihrerin erklart Besuchern, was der Maler durch seine Farben ausdriicken will. 

• Erklarung als Angabe von Ursachen fur bestimmte Sachverhalte 

0 Der Lehrer erklart den Eltern, dass ihr Sohn Dirk regelmaBig seine Mitschiiler 
angreift, weil er vergeblich versucht hat, die Anforderungen in der Schule zu erfullen. 

• Erklarung als Angabe von Ursachen fur bestimmte Zusammenhange 

0 Der Marktpsychologe erklart dem Vorstand, dass Verbraucher nicht-gekaufte 
Produkte abwerten, weil dadurch unangenehme Dissonanzen reduziert werden. 

Nur die beiden letzten Formen von alltaglichen Erklarungen entsprechen dem, was 
man unter wissenschaftlichen Erklarungen versteht: Sie zielen auf die Angaben von 
Ursachen fiir einzelne Sachverhalte oder regelmaBige Zusammenhange ab. 
Wissenschaftliche Erklarungen sind also kausale Erklarungen. 

Wie schon in diesen einleitenden Charakterisierungen deutlich wird, setzt eine 
Erklarung immer die Beschreibung des zu erklarenden Sachverhaltes voraus. Streng 
genommen werden nicht Sachverhalte erklart, sondern Aussagen liber Sachverhalte. 
Erklarung ist deshalb immer Erklarung unter einer bestimmten Beschreibung. 
Verandert man die Beschreibung, verandert sich auch die Erklarung. 

Die Wissenschaftsphilosophie hat sich intensiv mit der Frage beschaftigt, 
wodurch eine adaquate wissenschaftliche Erklarung gekennzeichnet ist. Sie hat dabei 
zunachst einen logisch-systematischen Ansatz gewahlt. Er sieht von den beteiligten 
Personen ab und beschaftigt sich nur mit der Beziehung zwischen dem erklarten und 
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dem erklarenden Sachverhalt. Bei pragmatischen Erklarungskonzeptionen dagegen 
wird der Verwendungszusammenhang mit berlicksichtigt. 

Eine aus logisch-systematischer Sicht stringente und ideale Form der kausalen 
wissenschaftlichen Erklarung ist die deduktiv-nomologische Erklarung, die im 
folgenden Kapitel 8.1 beschrieben wird. Falls die zur Erklarung herangezogenen 
GesetzmaBigkeiten nicht deterministisch, sondern probabilistisch sind, haben 
Erklarungen keinen deduktiv-logischen Charakter mehr, sondern sind induktive, 
probabilistische Erklarungen (Kapitel 8.3). Pragmatische Erklarungskonzeptionen 

one 

werden im Kapitel 8.4 dargestellt. 



8.1 Deduktiv-nomologische Erklarung 

Die Idealform von wissenschaftlichen Erklarungen sind deduktiv-nomologische. Sie 
beruhen auf nomologischen (gesetzesartigen) Aussagen und deduktiven (logischen) 
Ableitungen: „Einen Vorgang 'kausal erklaren’ heiBt, einen Satz, der ihn beschreibt, 

396 

aus Gesetzen und Randbedingungen logisch ableiten“. 

0 Das ZerreiBen eines Fadens ist erklart, wenn festgestellt wird, dass der Faden eine Zer- 
reiBfestigkeit von 1 kg hat und mit 2 kg belastet worden ist. Diese Erklarung enthalt 
(implizit) die Gesetzeshypothese „Wenn ein Faden iiber eine bestimmte ZerreiBfestigkeit 
hinaus belastet wird, zerreiBt er“, sowie als Aussagen iiber Randbedingungen „Der Faden 
hat eine ZerreiBfestigkeit von 1 kg“ und „Der Faden ist mit 2 kg belastet worden“. 

8.1.1 Explanandum und Explanans 

Die Beschreibung des zu erklarenden Sachverhalts wird als Explanandum (das zu 
Erklarende) bezeichnet. Es kann eine Aussage iiber einen einzelnen (singularen) 
Sachverhalt oder eine allgemeingultige, gesetzesartige Aussage sein. 

Die Aussagen, aus denen das Explanandum logisch ableitbar sein soil, bilden das 
Explanans (d.h. das Erklarende). Es muss mindestens ein allgemeingiiltiges Gesetz 
enthalten. AuBerdem enthalt ein Explanans mindestens eine Rand- oder Antezedens- 
bedingung, d.h. eine Aussage dariiber, dass die Bedingungen fur die Anwendbarkeit 
des Gesetzes gegeben sind. 

Jede der Antezedensbedingungen ist einzeln notwendig und zusammen mit den 
anderen Antezedensbedingungen und Gesetzesannahmen hinreichend fiir die 
Ableitung des Explanandums. Im Sinne der Inus-Explikation aus Kapitel 7.2.3 ist 



395 

Dieses Kapitel 8 beruht vor allem auf den Analysen von Hempel (1965) und Stegmiiller 
(1983). Weitere Darstellungen und Entwicklungen: Westmeyer (1972), Groeben & 
Westmeyer (1975, S. 76-106), Opp (1976, S. 124-185), Salmon (1984, 1989, 1994), 
Groeben (1986), Sprung & Sprung (1987, S. 290-295), Schurz (1988a), Ruben (1993), 
Bunge (1997) 

396 Popper (1994, S. 31-32) 
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deshalb jeder der in den Antezedensbedingungen beschriebenen Sachverhalte eine 

OQ7 

Ursache fur den durch das Explanandum beschriebenen Sachverhalt. 

Logische Ableitung 

Die deduktiv-nomologische Erklarung eines singularen Sachverhaltes besteht in der 
logischen Ableitung der Sachverhaltsbeschreibung E aus der Konjunktion einer 
Menge G von deterministischen Gesetzen und einer Menge A von Antezedens- 
bedingungen. Die folgende Darstellung wird als Hempel-Oppenheim-Schema der 
Erklarung bezeichnet: 398 

(8-17) Explanans G = { Gi, G n } Gesetzesaussagen 

A = {A}, A m } Antezedensbedingungen 

Explanandum E Sachverhaltsbeschreibung 

Falls zur Erklarung nur ein Gesetz und eine Antezedensbedingung notwendig ist, 
ergibt sich folgender Spezialfall: 

(8-18) Explanans Vx: U(x)cp— >V(x) 

U(a) 

Explanandum V (a) 

Die Gesetzesaussage ist als implikativer Allsatz mit Ceteris-paribus-Bedingung 
dargestellt. In der Antezedensbedingung wird festgehalten, dass fur Person oder 
Objekt a die Bedingung U gegeben ist. Daraus folgt, dass fur a auch der Sachverhalt 
V gelten muss (siehe den modus ponens der Aussagenlogik, Kapitel 3.4.1). 

0 Sonja bewertet neuerdings Greifswald viel positiver als friiher (Sachverhaltsbeschreibung 
E). Wie konnen wir das erklaren? Wir stellen fest, dass Sonja lange unschliissig war, ob 
sie im Zulassungsverfahren fur Psychologie Greifswald oder Potsdam als ersten 
Studienortwunsch angeben soil. SchlieBlich hat sie sich aber fur Greifswald entschieden 
(Antezedensbedingung A). Genial.) der Dissonanztheorie wird nach einer Entscheidung 
die gewahlte Alternative aufgewertet (Gesetzesannahme G). Die Entscheidung Sonjas fur 
Greifswald konnen wir demnach als die Ursache fur ihre positivere Bewertung der Stadt 
bezeichnen. 9 



397 Stegmiiller (1983, S. 535) definiert dagegen die Totalitat der Antezedensbedingungen 

als Ursache. 

398 

Hempel & Oppenheim (1948), Hempel (1972). Man spricht auch vom Supsumtions- 
modell ( covering law model), da das zu Erklarende einem Gesetz untergeordnet wird. 
Kritisch zur Anwendung in der Psychologie: Manicas & Secord (1983). 

399 Zusatzlich muss man bei derartigen Erklarungen annehmen, dass alle anderen relevanten 
Bedingungen gleich geblieben sind ( Ceteris-paribus-Bedingung , siehe Kapitel 7.2.4). 
Ohne derartige Ceteris-paribus-Bedingungen erhalt man keine eindeutigen Erklarungen. 
Im Beispiel ware die CP-Bedingung verletzt, wenn Sonja zwischen der ersten und 
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Abstraktion und Reduktion 

Die in derartigen Erklarungen verwendeten Gesetzesannahmen sind abstrakter als die 

jeweiligen Beschreibungen der zu erklarenden Sachverhalte. Diese Erklarungen 

durch Abstraktion sind typisch fur das theorie-orientierte und rationalistische 

• • 

Vorgehen in der Physik und der Okonomie sowie in der Sozial-, Kognitions- und 
Personlichkeitspsychologie. Besonders in empiristisch orientierten Forschungs- 
bereichen findet man auch Erklarungen durch Reduktion, d.h. durch Verweis auf 
konkretere zugrunde liegende Mechanismen: Psychische Prozesse werden durch 
neuronale Strukturen und Ablaufe erklart, die neuronalen Prozesse durch chemische 
Reaktionen und diese werden schlieBlich auf physikalische zuriickgeftihrt. 400 

Erklaru ngsketten 

Jeder Sachverhalt, der in einer Antezedensbedingung beschrieben ist, kann wiederum 
erklart werden, das heiBt er kann das Explanandum einer weiteren deduktiv- 
nomologischen Erklarung sein. 

0 Um zu erklaren, warum Sonja Greifswald und nicht Potsdam als ersten Studienortwunsch 
gewahlt hat, befragen wir sie und erfahren, dass fiir sie drei Kriterien relevant waren: die 
fachliche Qualitat der Ausbildung schien ihr insgesamt etwa gleich hoch zu sein, in 
Greifswald wiirde sie hochst wahrscheinlich eine schone Wohnung bekommen, 
wohingegen sie in Potsdam vielleicht eher einen guten Nebenverdienst bekommen wiirde. 
Die Wahl von Greifswald folgt aus diesen Antezedensbedingungen zusammen mit der 
sehr gut gewahrten Gesetzesannahme, dass bei jeder Entscheidung der erwartete Nutzen 
maximiert wird. 

Die in dieser Erklarung verwendeten Antezedensbedingungen konnen wiederum 
deduktiv-nomologisch erklart werden usf.. Dadurch konnen ganze Erklarungsketten 
entstehen. Wenn in unterschiedlichen Stadien einer Erklarungskette die gleichen 
Variablen auftreten, kann ein zirkelhafter Wirkungsprozess entstehen, der sich selber 
stabilisiert oder aufschaukelt. 

0 Die Armut einer Person kann durch ihre Arbeitslosigkeit zu erklaren sein, die Arbeits- 
losigkeit durch ihre unzureichende Mobilitat und diese wiederum durch die Armut. 

Erklarungen von Gesetzen und Theorien 

Nicht nur einzelne Sachverhalte konnen wissenschaftlich erklart werden, sondern 
auch Gesetze und Theorien. Eine deduktiv-nomologische Erklarung von Gesetzen 
liegt vor, wenn ein bestimmtes Gesetz G aus anderen Gesetzen Gi a G 2 a ...G n 



zweiten Erhebung sich in jemanden verliebt hatte, der in Greifswald wohnt. Ihre 
positivere Bewertung ware dann nicht nur durch Dissonanzreduktion zu erklaren. 
Valentine (1991, S. 112-114), Bunge (1997), Scott (1995, S. 2-5, 159-162) 
zu Entscheidungstheorien und Erwartungswertmodellen: Jungermann et al. (1998) 
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abgeleitet werden kann. Empirische Antezedensbedingungen spielen in diesem Fall 
keine Rolle. Wir haben es mit einer rein theoretischen Erklarung zu tun. 

0 Zu erklaren sei die spezielle dissonanztheoretische Gesetzesannahme „Nach einer 
Entscheidung wird die gewahlte Alternative aufgewertet.“ Sie kann aus einer 
Verkniipfung von anderen dissonanztheoretischen Gesetzesannahmen abgeleitet werden: 

- Das Wissen um eine getroffene Entscheidung steht in Dissonanz mit den negativen 
Aspekten der gewahlten Alternative. 

- Die Dissonanz ist umso groBer, je negativer diese Bewertung ist. 

- Dissonanz fiihrt zu Bestrebungen, sie durch kognitive Veranderungen zu reduzieren. 

Wird nicht nur ein Gesetz G, sondern eine ganze Theorie T, die aus einer Menge von 
zusammengehorigen Gesetzen besteht, aus einer anderen Theorie Ti abgeleitet und 
damit erklart, liegt eine Reduktion von T auf T , vor. 

0 Die Neo-Behavioristen Dollard, Miller und Mowrer haben die Grundprozesse und 
Grundannahmen der Psychoanalyse in der Terminologie der Lerntheorie ausgedriickt. 2 
0 Die Raum-Zeit-Theorie der klassischen Physik lasst sich vollstandig in Einsteins spezielle 
Relativitatstheorie einfiigen. 

Eine Theorie T, die auf eine Theorie T t reduziert werden kann, ist streng genommen 
uberfllissig, weil alle Aussagen von T vollstandig aus den Aussagen von T! folgen. 
Mit Reduktionsversuchen ist deshalb mitunter der Anspruch verbunden, ganze 

Theorien oder Wissenschaftsdisziplinen iiberflussig zu machen. 

. • • 

0 Die eliminativen Materialisten Paul und Patricia Churchland sind der Uberzeugung, dass 

alle mentalen und kognitiven Begriffe und Theorien der Psychologie durch neuro- 

biologische Konzepte ersetzt werden miissen. 

Tatsachlich lassen sich Theorien kaum jemals vollstandig auf andere reduzieren und 
dann eliminieren. Sehr sinnvoll ist es aber, Theorien systematisch miteinander zu 
verbinden, um zu beschreiben, wie abstraktere Konzepte und Prozesse auf 
konkreteren Ebenen realisiert werden konnen (siehe unten Kapitel 11.6). 

8.1.2 Adaquatheitsbedingungen 

Als adaquat wird eine deduktiv-nomologische Erklarung nur dann bezeichnet, wenn 
verschiedene Bedingungen erflillt sind: 

1 . Die logische Ableitung muss korrekt sein. 

2. Das Explanans muss mindestens ein allgemeines Gesetz enthalten. 

3. Das Explanans muss empirischen Gehalt haben. 

4. Die Aussagen im Explanans miissen wahr oder zumindest gut bewahrt sein. 



Davison & Neale (1996, S. 686), Pongratz (1973, S. 373) 
Balzer (1982, S. 219), Breuer (1996, S. 351), Scheibe (1997) 
Bechtel (1988b, Abschn. 5 und 6), siehe oben Kapitel 2.2. 3. 3 
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Nach der ersten Bedingung muss das Explanandum tatsachlich logisch aus dem 
Explanans folgen. Dadurch werden logisch falsche oder nicht zwingende Argumente 
vom Explanans auf das Explanandum ausgeschlossen. 

0 Genau genommen lautet die dissonanztheoretische Gesetzesannahme iiber die Bewertung 
der Alternativen nach Entscheidungen, dass nach einer Entscheidung die relative 
Attraktivitat der gewahlten Alternative erhoht wird, d.h. die gewahlte Alternative 
aufgewertet oder die nicht-gewahlte Alternative abgewertet wird. Legen wir diese 
Gesetzesannahme zugrunde, kann nicht zwingend abgeleitet werden, dass der gewahlte 
Studienort von Sonja positiver bewertet wird als vorher. Unsere urspriingliche Erklarung 
ist also streng genommen nicht korrekt. 

Nach der zweiten Bedingung muss die zur Erklarung herangezogene Gesetzes- 
annahme einer Konditionalaussage entsprechen, die sich auf alle Elemente eines 
unerschopflichen Gegenstandsbereiches bezieht. Annahmen iiber einen abgeschlos- 
senen Geltungsbereich sind zur wissenschaftlichen Erklarung nicht geeignet, weil fur 
jeden zu erklarenden Sachverhalt eine spezielle Gesetzesannahme formuliert werden 
kann (siehe Kapitel 7.1.4). 

0 Im Abteil eines Zuges trifft Fritz Meyer seine ehemaligen Mitschiilerinnen Sonja und 
Anja, die im ersten Semester Psychologie in Greifswald studieren. Er stellt fest, dass 
beide Greifswald deutlich positiver bewerten als friiher. Wiirde man Aussagen mit 
beschranktem Geltungsbereich als Gesetze und Pramissenteile von Erklarungen zulassen, 
konnte man Sonjas positivere Bewertung auch dadurch „erklaren“, dass alle Psycho- 
logiestudentinnen in diesem Abteil Greifswald positiver bewerten. 

Sinnvollerweise ist diese zweite Bedingung so zu verstehen, dass das allgemeine 
Gesetz nicht nur ein Assoziationsgesetz, sondern ein Kausalgesetz darstellt (vgl. 
oben Kapitel 7.2.7). Durch eine wissenschaftliche Erklarung eines Sachverhalts 
sollen tatsachliche Ursachen oder, anders ausgedriickt, Realgriinde benannt werden. 
Die zur Erklarung herangezogenen Gesetze sollen moglichst die Mechanismen und 
Prozesse beschreiben, die dem zu erklarenden Sachverhalt zugrunde liegen. 405 
Assoziationsgesetze liefern jedoch nur Vernunftgriinde, das heiBt Grtinde fur die 
Erwartung, dass der entsprechende Sachverhalt eintritt. 

Nach der dritten Bedingung muss es moglich sein, dass die Gesetzesannahme sich 
auf Grund von empirischen Befunden als falsch erweist (vgl. unten Kapitel 9.2). 
Damit schlieBen wir Erklarungen durch tautologische und damit informationslose 
Gesetzesannahmen aus. 

0 Eine Gesetzesannahme, dass die gewahlte Alternative nach der Entscheidung positiver, 
negativer oder gleich bewertet wird, ist mit zwar Sonjas positiverer Bewertung von 
Greifswald vertraglich, sie ist aber auch mit jeder anderen Bewertung vertraglich. Sie 
erklart alles und damit nichts. 



405 



Bunge (1997) 
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Mit der vierten Adaquatheitsbedingung soli vermieden werden, dass Gesetze oder 
Antezedensbedingungen, die empirisch noch nicht hinreichend uberpriift sind oder 
sich sogar als zweifelhaft herausgestellt haben, zur Erklarung beobachtbarer 
Sachverhalte verwendet werden. Dass eine Gesetzesannahme im interessierenden 
Kontext giiltig ist, kann allerdings meist nicht direkt gepriift werden. Es bleibt stets 
eine empirische Vermutung : ein induktives Argument unter Unsicherheit, das mehr 
oder minder berechtigt sein kann (vgl. Kapitel 4.3). 

8.1.3 Dispositionelle Erklarungen 

In der Psychologie werden Aussagen iiber das Verhalten oder Erleben von Personen 
haufig dadurch erklart, dass man auf bestimmte Dispositionen dieser Personen 
verweist: auf Eigenschaften, Fahigkeiten, Uberzeugungen, Ziele usw. 406 Im 
einfachsten Fall hat eine dispositionelle Erklarung folgende Struktur: 

(8-19) Explanans Vx: D(x) a U(x) cp -> V(x) dispositionelles Gesetz 

D(a) a U(a) Antezedensbedingungen 

Explanandum V(a) Sachverhaltsbeschreibun 

g 

Nach dem angenommenen Gesetz soil fur alle Personen oder Objekte (einer 
bestimmten Population) das Vorliegen der Bedingung U und der Disposition D 
ceteris paribus hinreichend fur das Auftreten von V sein. In der Antezedens- 
bedingung wird fur eine bestimmte Person a die Bedingung U und die Disposition D 
festgestellt. Daraus folgt dann eindeutig, dass fur diese Person a auch V auftreten 
muss. 

0 Eine Studentin entscheidet sich in der ersten Sitzung eines Seminars fur ein Referats- 
thema, das vom Seminarleiter weder den ganz leichten noch den ganz schwierigen 
Themen zugeordnet worden ist. Der Seminarleiter erklart diese Entscheidung dadurch, 
dass diese Studentin freie Wahl zwischen den unterschiedlich anspmchsvollen Themen 
hatte und dass sie bekanntermaBen hoch leistungsmotiviert ist (Antezedensbedingungen). 
AuBerdem zieht er ein Gesetz aus dem Risiko-Wahl-Modell heran: Wenn eine Person 
hoch leistungsmotiviert ist und zwischen verschieden schweren Aufgaben wahlen muss, 
dann wahlt sie bevorzugt mittelschwere Aufgaben. 407 

8.1.4 Erklarungen, Vorhersagen und Diagnosen 

Deduktiv-nomologische Erklarungen sind mit wissenschaftlichen Vorhersagen und 
Diagnosen verwandt: Ihre syntaktische Struktur ist gleich, die pragmatischen 



406 Zur Einfiihrung von Dispositionsbegriffen iiber bedingte Definitionen siehe Kapitel 5.3. 

407 Atkinson (1957), Weiner (1988), Heckhausen (1989) 
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Zusammenhange (d.h. die Anwendungsumstande) variieren allerdings systema- 
tisch. 408 

Erklarungen und Vorhersagen 

Bei einer deduktiv-nomologischen Erklarung wird das Explanandum aus dem 
Explanans abgeleitet. Vorhersagen haben die gleiche syntaktische Struktur. Die 
pragmatischen Umstande unterscheiden sich jedoch. 

• Bei einer Erklarung ist der zu erklarende Sachverhalt bekannt, und es mlissen 
adaquate Gesetze und Antezedensbedingungen bestimmt werden, aus denen 
dieses Explanandum ableitbar ist. 

• Bei Vorhersagen wird aus Antezedensbedingungen und Gesetzen eine Aussage 
liber einen Sachverhalt abgeleitet, der unbekannt ist. 

- Ist dieser Sachverhalt ein zukiinftiger, spricht man von einer Prognose. 

- Die Vorhersage eines vergangenen, aber unbekannten Zustandes ist eine 

Retrognose. 

Jede vollstandige, deduktiv-nomologische Erklarung entspricht also einer richtigen 
Retrognose und damit einer richtigen Vorhersage. Auf der anderen Seite ist nicht 
jede richtige Vorhersage auch eine adaquate wissenschaftliche Erklarung. Der Grund 
fur diese Asymmetrie ist offensichtlich: Erklarungen erfordern Kausalgesetze, 
erfolgreiche Vorhersagen sind hingegen auch mit Assoziationsgesetzen moglich. 

0 Mit dem Assoziationsgesetz „Wenn eine Person im Intelligenz-Struktur-Test (IST 2000) 
einen IQ iiber 100 hat, dann hat sie im Hamburg- Wechsler-Intelligenztest fur Erwachsene 
(HAWIE-R) einen IQ liber 80“ kann man aus dem IST-IQ den HAWIE-IQ vorhersagen, 
aber nicht erklaren. 

Erklarung und Diagnose 

Als Diagnose bezeichnet man in Medizin und Psychologie (im libertragenen Sinn 
auch in anderen Bereichen) die Angabe einer fallspezifischen Ursache fiir einen 
auffalligen oder storenden Sachverhalt. In einer diagnostischen Situation ist der zu 
erklarende Sachverhalt bekannt. Gesucht sind die individuellen Antezedensbedin- 
gungen (personliche Eigenschaften oder Erfahrungen), aus denen (zusammen mit be- 
wahrten GesetzmaBigkeiten) das Explanandum abgeleitet werden kann. Eine adaqua- 
te Diagnose stellt damit auch eine adaquate Erklarung dar: Der zu erklarende Sach- 
verhalt ware nicht eingetreten, wenn, unter sonst gleichen Bedingungen, die dia- 
gnostizierte Bedingung nicht vorgelegen hatte. 



408 



Hempel (1965), Westmeyer (1972), Opp (1976, S. 163-185), Gadenne (1992), 
Waldmann & Holyoak (1992, S. 227) 
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8.1.5 Teleologische Erklarungen 

Erklarungen, die sich auf Ziele, Zwecke oder zuklinftige Ereignisse und Zustande 
beziehen, werden als teleologisch oder intentional bezeichnet. 409 Sprachlich 
entsprechen teleologische Erklarungen Satzen mit um zu, damit, weil usw. 
Teleologische Erklarungen sind im Alltag sehr haufig, in der Wissenschaft findet 
man sie vor allem in der Psychologie und den Geschichtswissenschaften. 

0 Menschen greifen zu „Notltigen“, um Konflikte zu vermeiden. 410 
0 Premierminister Chamberlain reiste nach Mimchen, um den Krieg zu verhindern. 

Auf den ersten Blick scheint man teleologische Erklarungen scharf von kausalen 
Erklarungen separieren zu miissen. Teleologische Erklarungen des menschlichen 
Handelns beziehen sich offenbar nicht auf (objektive) Ursachen, sondern auf 
(subjektive) Griinde, und sie scheinen Gegenwartiges durch etwas Zukiinftiges 
erklaren zu wollen 411 

Die Struktur einer teleologischen Erklarung kann durch den praktischen 
Syllogismus beschrieben werden, der auf Aristoteles zuriickgeht: 

(8-20) Die Person p will den Zustand z herbeifiihren. 

p ist uberzeugt, dass z nur eintritt, wenn sie v ausflihrt. 
p flihrt v aus. 

Bei genauerer Betrachtung erweisen sich auch teleologische Erklarungen als 
deduktiv-nomologische Erklarungen im iiblichen Sinne, die den betrachteten 
Sachverhalt auf (vorangegangene) Antezedensbedingungen und (meist implizite) 
Gesetzesannahmen zuriickfuhren. Erstens wird der Sachverhalt nicht durch das 
zuklinftige Ereignis erklart, sondern durch den gegenwartigen oder vergangenen 
Wunsch, bestimmte Ziele zu erreichen. Zweitens sind Wunsche und Uberzeugungen 
dartiber, dass bestimmte Handlungen bestimmte Folgen haben, in Strukturen und 
Prozessen des Gehirns realisiert, die materielle Ursachen fur andere Ereignisse sein 
konnen. 412 

Drittens folgt bei einem praktischen Syllogismus die zu erklarende Aussage nur 
dann zwingend aus der Pramisse, wenn man eine allgemeine GesetzmaBigkeit 



von Wright (1979), Martin (1995) 

410 Wiemann & Giles (1996, S. 354) 

411 Greve (1994, 1997), Macnamara, Govitrikar & Doan (1988). Die Erklarung von 
Handlungen durch allgemeine Ursache-Wirkungs-Gesetze wird nach Kurt Lewin als 
Galileische Tradition bezeichnet (Bischof, 1981; Lewin, 1986, S. 14-17; Stegmiiller, 
1983, S. 483). Die teleologische Erklarung des Handelns entspricht dagegen der 

Aristotelischen Tradition. 

412 

Pylyshyn (1981), vgl. oben Abschnitt 2.2.4. 1 zum Funktionalismus 
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hinzufugt, die Intentionen und Uberzeugungen mit Verhalten verbindet. Sie kann 
wie folgt formuliert werden: 

(8-21) Wenn eine Person p einen Zustand z herbeifiihren will und wenn p 

uberzeugt ist, dass das Verhalten v fur z notwendig ist, dann fiihrt p 
das Verhalten v aus. 



8.1.6 Erklaren und Verstehen 

Wenn versucht wird, Geistes- und Naturwissenschaften zu unterscheiden (siehe oben 
Seite 40), wird immer wieder auch auf den vermeintlichen Gegensatz zwischen 
Erklaren und Verstehen verwiesen. Kausale Erklarungen, so wird dann behauptet, 
seien auf die exakten Naturwissenschaften beschrankt, weil nur dort strenge 
Ursache-Wirkungs-Zusammenhange zu finden seien. Menschliches Handeln und 
Erleben, also die Gegenstandsbereiche der Psychologic, aber auch der Geschichts-, 
Sozial-, Kunst- und Literaturwissenschaften, konne nicht kausal erklart, sondern nur 
in ihrer jeweiligen Einmaligkeit verstanden werden. Erreicht werden soil dieses 
Verstandnis, indem man sich in die Lage der anderen Person hineinversetzt und 
„einfiihlt“. 

Innerhalb der Psychologie hat die Gegeniiberstellung von Erklaren und Verstehen 
eine lange Tradition und wird auch heute noch von verschiedenen Positionen aus 
intensiv diskutiert. 414 Wilhelm Dilthey formulierte Ende des 19. Jahrhundert 
pragnant „Die Natur erklaren wir, das Seelenleben verstehen wir“. 415 Dilthey 
beschrieb die Methode des Verstehens als Grundlage einer geisteswissenschaftlichen 
Psychologie und der Geisteswissenschaften insgesamt. Er wandte sich damit gegen 
die naturwissenschaftliche und erklarende Orientierung der Psychologie, die zu 
dieser Zeit insbesondere Hermann Ebbinghaus vertrat. 416 

Die These vom unaufloslichen Konflikt zwischen Erklaren und Verstehen beruht 
jedoch auf einem unvollstandigen Verstandnis dessen, was eine wissenschaftliche 
Kausalerklarung und was ein wissenschaftliches Verstandnis sein kann. Bei naherer 
Betrachtung sind Erklaren und Verstehen gar keine unversohnlichen Gegensatze. 
Erklaren und Verstehen sind vielmehr voneinander abhangig und erganzen einander. 

Durch einfiihlendes Verstehen konnen wir ohne Zweifel zu Erkenntnissen 

gelangen. Zum einen konnen wir Feststellungen iiber konkrete, fur eine bestimmte 

Person geltende Sachverhalte treffen: iiber ihre Wahrnehmungen und Empfindungen, 

• • 

Ziele und Motive, Erfahrungen, Uberzeugungen usw. Wir konnen damit unter 
anderem Aussagen iiber die Griinde ihres Tuns machen. Zum anderen konnen wir 



Beckermann (1979, S. 475-485) 

Balmer (1982), Dierstein (1995), Greve (1997), Gadenne (1997a), Groeben (1986), 
Manicas (1997), Patzig (1973), Traxel (1974, S. 405-412) 
zit. nach Balmer (1982, S. 109), Groeben (1986, S. 2) 

Lander (1993) 
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durch einfiihlendes Verstehen Einsichten in RegelmaBigkeiten gewinnen, die bei 
einer bestimmten Person oder bei alien Personen auftreten. 

Auch wenn diese Erkenntnisse fur uns sehr evident und plausibel wirken, haben 
sie zunachst einmal hypothetischen Charakter. Dass sie durch die Methode des 
Verstehens gewonnen worden sind, garantiert noch nicht ihre Wahrheit, schlieBt sie 
aber selbstverstandlich auch nicht aus. Auf jeden Fall sollten sie an Hand von 
weiteren Beobachtungen ausreichend empirisch abgesichert werden. Wenn dies 
gelingt, konnen sie als Antezedensbedingungen bzw. Gesetzesannahmen in der 
iiblichen Weise in wissenschaftlichen Erklarungen verwendet werden. 

Eine zweite Verbindung zwischen Erklaren und Verstehen besteht darin, dass das 
„Verstehen“ unseren Zustand bezeichnen kann, wenn wir fur einen bestimmten 
Sachverhalt eine akzeptable „Erklarung“ vorliegen haben: Wir verstehen einen 
Sachverhalt, wenn wir seine Ursachen kennen. Explizit benannt und erkannt werden 
dabei meist nur die fall- und situationsspezifischen Antezedensbedingungen. Da die 
ebenfalls zur Erklarung notwendigen Ursache-Wirkungs-Annahmen meist implizit 
bleiben, haben wir falschlicherweise den Eindruck, dass wir den Sachverhalt nicht 
nomologisch erklart, sondern fallspezifisch verstanden haben. 



8.2 Probabilistische Erklarungen 

Bei deduktiv-nomologischen Erklarungen wird vorausgesetzt, dass die heran- 
gezogenen Gesetze deterministisch sind. Viele wissenschaftliche Gesetzesannahmen 
sind aber probabilistisch zu verstehen (siehe Kapitel 7.1.5). Wie wir im folgenden 
sehen werden, hat es sich als schwierig erwiesen, den Begriff der wissenschaftlichen 
Erklarung auch fur probabilistische Gesetze in befriedigender Weise zu explizieren. 

8.2.1 Statistische Syllogismen 

Ubertragt man das Prinzip der deduktiv-nomologischen Erklarung auf den Fall 
probabilistischer Aussagen, erhalt man sog. statistische Syllogismen: Aus einer 
Menge von Gesetzen, von denen mindestens eines probabilistisch ist, und einer 
Menge von Antezedensbedingungen wird eine Aussage iiber die Wahrscheinlichkeit 
eines Sachverhalts abgeleitet. Fur den einfachen Fall mit einem probabilistischen 
Gesetz und einer Antezedensbedingung ergibt sich folgendes Schema: 

(8-22) Vx: P(V(x) |U(x)) = p 

U(a) 

P(V(a)) = p 

Das probabilistische Gesetz besteht in der Aussage, dass die Wahrscheinlichkeit fur 
einen bestimmten Sachverhalt V gleich einer bestimmten Zahl p ist, falls der 
Sachverhalt U gegeben ist. Die Antezedensbedingung stellt fest, dass fur die Person 
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oder das Objekt a der Sachverhalt U gilt. Daraus wird das Explanandum abgeleitet: 
Die Wahrscheinlichkeit, dass flir Objekt a auch Sachverhalt V gilt, ist gleich p. 

0 Eine Person a sei an Schizophrenic erkrankt. Dieser Sachverhalt E soli erklart werden. 
Als Ursachen kommen sowohl genetische Veranlagungen wie Lebensbelastungen in 
Frage. Bei der Anamnese wird festgestellt, dass auch seine Ehefrau kurzlich wegen einer 
Schizophrenic in Behandlung gewesen ist (Rand- oder Antezedensbedingung Ai). Geht 
man von den vorliegenden Befunden aus, betragt die Erkrankungswahrscheinlichkeit 
etwa 1%, wenn auch der Ehepartner einmal an Schizophrenie erkrankt ist. Nehmen wir 
an, dass dieser empirische Zusammenhang einem probabilistischen Gesetz pGi 
entspricht, erhalten wir folgende deduktiv-statistische Erklarung: 

(8-23) P(Schizophrenie I Ehepartner schizophren) = 0,01 pGi 

Ehefrau von a ist schizophren 

P(Person a ist schizophren) = 0,01 P(E) 

Fur die gleiche Aussage E konnen aber unterschiedliche Wahrscheinlichkeiten ab- 
geleitet werden, wenn andere probabilistische Gesetze verwendet werden. 

0 Bei einer zweiten Anamnese von a wird festgestellt, dass auch sein eineiiger Zwillings- 
bruder bereits an einer Schizophrenie erkrankt ist. Nach den vorliegenden Befunden 
betragt die Erkrankungswahrscheinlichkeit etwa 44%, wenn auch ein eineiiger Zwilling 
an Schizophrenie erkrankt ist. Legen wir ein entsprechendes Gesetz pG 2 zugrunde, 
erhalten wir eine andere Wahrscheinlichkeit fiir den zu erklarenden Sachverhalt E: 18 

(8-24) P(Schizophrenie leineiiger Zwilling schizophren) = 0,44 pG 2 

eineiiger Zwilling von a ist schizophren A 2 

P(Person a ist schizophren) = 0,44 P(E) 

Beim statistischen Syllogismus konnen aus Pramissen, die als wahr angenommen 
worden sind und die sich nicht widersprechen, also Konklusionen abgeleitet werden, 
die sich widersprechen. Wegen dieser Widerspriichlichkeit sind statistische Syllo- 
gismen keine befriedigende Explikation von wissenschaftlichen Erklarungen. Eine 
direkte Ubertragung des Prinzips der deduktiv-nomologischen Erklarung auf den Fall 
probabilistischer Gesetze scheint damit nicht sinnvoll zu sein. 

8.2.2 Induktiv-statistische Systematisierungen 

Eine Erklarung mit Hilfe von probabilistischen Gesetzen kann auch als induktives 
Argument betrachtet werden. Die Aussage E tiber den zu erklarenden Sachverhalt 



" 1 ' Davison & Neale ( 1 996, S . 464) 

418 

In der Fachliteratur werden zur Illustration probabilistischer Gesetze meist sehr groBe 
bedingte Wahrscheinlichkeiten unterstellt, die in der Psychologie kaum zu finden sind. 
Die Bedeutung eines probabilistischen Zusammenhangs wird jedoch nicht durch die 
absolute Hohe der bedingten Wahrscheinlichkeit bestimmt, sondern durch die Differenz 
zwischen der bedingten und der unbedingten Wahrscheinlichkeit. 
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wird dann mehr oder minder stark vom Explanans gestiitzt. Diese Form der wissen- 
schaftlichen Erklarung wird als induktiv-statistische Systematisierung bezeichnet. 419 



Sie kann wie folgt dargestellt werden: 




(8-25) Explanans 


G 


= {pG b ..., pG n } 


probabilistische Gesetze 




A 


— { Ai, A m } 


Antezedensbedingungen 




— 


[q] 




Explanandum 




E 


S achverhaltsbeschreibung 



Fur den Spezialfall eines probabilistischen Gesetzes und einer Antezedensbedingung 
ergibt sich folgende Spezifikation: 



(8-26) 



Vx: P(V(x) lU(x)) = p 
U(a) 



V(a) 




Mit [q] wird dabei die Starke der induktiven Stutzung des Explanandums durch das 
jeweilige Explanans bezeichnet. Wenn q nahe Eins ist, wird dem zu erklarenden 
Sachverhalt durch das Explanans eine fast vollstandige induktive Stutzung verliehen. 

Mit den induktiv-statistischen Systematisierungen sind schwierige konzeptuelle 
Probleme verbunden, von denen nur einige ganz kurz angerissen werden konnen. 

Schon die adaquate Definition und Spezifikation des induktiven StutzungsmaBes 
q ist schwierig, wenn nicht gar unmoglich (siehe Kapitel 4.3.1). Im gegenwartigen 
Zusammenhang kann q jedoch einfach gleich der Wahrscheinlichkeit p gesetzt 
werden, mit der nach dem probabilistischen Gesetz V eintritt, wenn U gegeben ist. 

0 Dass a schizophren ist, wird wesentlich starker durch den schizophrenen Zwillingsbruder 
gestiitzt und erklart (q = 0,44) als durch die schizophrene Ehefrau (q = 0,01). 

Ein Explanandum kann somit durch verschiedene Gesetze (und Antezedens- 
bedingungen) in unterschiedlichem MaBe gestiitzt werden. Da zwischen Explanans 
und Explanandum kein Implikationsverhaltnis besteht, beinhalten unterschiedliche 
Stutzungen des gleichen Sachverhalts zwar keinen logischen Widerspruch, aber eine 
Ambiguitat, die den Nutzen dieser Konzeption betrachtlich beeintrachtigt. 

Um diese Ambiguitat zu reduzieren, sollte zum einen moglichst das gesamte 
relevante und verfligbare Erfahrungswissen berlicksichtigt werden. 

0 Ist bei der schizophrenen Person a sowohl der eineiige Zwilling als auch die Ehefrau 
schizophren, sollten beide Antezedensbedingungen sowie die Wahrscheinlichkeit 
P(Schizophrenie I eineiiger Zwilling und Ehefrau schizophren) genutzt werden. 

Zum anderen sollten die Gesetze und Antezedensbedingungen in der Pramisse einer 
induktiv-statistischen Systematisierung so spezifisch und bestimmt sein wie moglich. 



419 



Hempel (1962, 1965) 
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0 P(Schizophrenie I Zwilling schizophren) ist bestimmter als P(Schizophrenie I Geschwister 
schizophren), da die Klasse der Zwillinge kleiner ist als die der Geschwister. 

Praktisch sind diese Forderungen meist nur approximativ zu erfiillen, da genaue 
Wahrscheinlichkeiten fur verbundene Ereignisse nicht ermittelt werden konnen. 

0 Einfache bedingte Wahrscheinlichkeiten wie P(Schizophrenie I Zwilling schizophren) 
lassen sich aus den Haufigkeiten in epidemiologischer Studien schatzen. Fur bedingte 
Wahrscheinlichkeiten mit Konjunktionen von Ereignissen, also z.B. P(Schizophrenie I 
Zwilling und Ehepartner schizophren), ist es meist viel schwieriger, entsprechende 
Haufigkeiten zu finden. Fur die Konjunktion aller individuellen Risikopradiktoren sind 
exakte Wahrscheinlichkeitsschatzungen in der Regel gar nicht moglich, weil die Zahl der 
Falle mit der jeweiligen Faktorenkombination viel zu gering ist. 

Insgesamt sind induktiv-statistische Systematisierungen umso berechtigter und 
akzeptabler, je umfangreicher und je bestimmter das beriicksichtigte Wissen ist. 



8.3 Pragmatische Erklarungskonzeptionen 

Bei den bisher betrachteten logisch-systematischen Konzeptionen zur Explikation 
adaquater wissenschaftlicher Erklarungen wurde ausschlieBlich das Explanans, das 
Explanandum und vor allem die Beziehungen zwischen ihnen analysiert. Die 
pragmatischen Erklarungskonzeptionen hingegen beziehen auch die Personen und 
Situationsumstande mit ein, in denen die jeweilige Erklarung stattfindet. Sie tragen 
damit der Tatsache Rechnung, dass eine Erklarung immer durch eine bestimmte 
Person abgegeben wird und haufig auch auf bestimmte Personen gerichtet ist. 

0 Ein Fehrer, ein Psychologe und ein Mediziner werden die regelmaBigen Angriffe von 
Dirk auf seine Mitschiiler sehr unterschiedlich erklaren. Der Psychologe beispielsweise 
wird auBerdem unterschiedliche Erklarungen geben, wenn er mit den Eltern, den 
Mitschiilern oder seinen Fachkollegen spricht. 

Die logisch-systematischen Erklarungskonzeptionen entsprechen zweistelligen 
Relationen („Aussage E, das Explanandum, wird durch Aussage A a G, das 
Explanans, erklart“). Die pragmatischen Erklarungskonzeptionen hingegen ent- 
sprechen drei- oder mehrstelligen Relationen („Person 1 erklart E durch A a G“, 
„Person 1 erklart der Person 2 in Situation S die Aussage E durch A a G“ usw.). 

Aus logisch-systematischer Sicht hangt die Adaquatheit einer Erklarung vor allem 
von der Wahrheit (oder Bestatigung) der Aussagen im Explanans und von der 
Korrektheit (oder Berechtigung) der Ableitung des Explanandums ab. Aus 
pragmatischer Sicht ist eine Erklarung adaquat, wenn die Personen, fur die sie 
gegeben wird, die genannten Ursachen und Zusammenhange tatsachlich verstehen 
und wenn sie die Aussagen und Argumentationen als ausreichend ausfiihrlich, 
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fundiert und iiberzeugend akzeptieren. Dieses Verstehen und Akzeptieren hangt 
natlirlich vom Wissens- und Erfahrungshintergrund der betreffenden Personen ab . 420 

Es gibt etliche Versuche, notwendige (und eventuell hinreichende) pragmatische 
Kriterien fur adaquate Erklarungen zu identifizieren . 421 Dabei wird deutlich, dass es 
nicht nur ein oder zwei adaquate Formen der wissenschaftlichen Erklarung gibt. Je 
nach Situation konnen vielmehr ganz unterschiedliche Formen der Beantwortung 
von Warum-Fragen adaquat sein. Diese Menge der adaquaten wissenschaftlichen 
Erklarungen kann nicht abschlieBend definiert werden, sie kann vielmehr nur grob 
durch Angabe verschiedener paradigmatischer Beispiele umrissen werden. 

Die logisch-systematischen Erklarungsformen, sowohl die deduktiv-nomo- 
logischen wie die probabilistischen, konnen sich auch nach pragmatischen Gesichts- 
punkten als adaquat erweisen, wenn die Voraussetzungen fur ihre Anwendbarkeit 
zumindest approximativ erfullt sind . 422 

AuBerdem gibt es verschiedene Abschwachungen der deduktiv-nomologischen 
Erklarung, die aus logisch-systematischer Sicht unvollkommen sind, die jedoch unter 
manchen Umstanden die bestmoglichen darstellen und als adaquat akzeptiert werden 
konnen. Einige ineinander tibergehende Formen dieser unvollstandigen Erklarungen 
werden im folgenden beschrieben. 

Partielle Erklarungen 

Viele Erklarungen, die in Alltag und Wissenschaft vorgeschlagen werden, erklaren 
den beschriebenen Sachverhalt nur teilweise oder ungenau. 

0 Ein Psychologe in einer Marketingagentur, der bisher immer die SPD gewahlt hat, 
bekommt den Auftrag, die Werbekampagne der CDU fur die Bundestagswahl zu leiten. 
In der Woche vor dem Wahltag tritt er in die CDU ein. Ein Kollege erklart dieses 
Ereignis mit Hilfe der Dissonanztheorie: Die durch einstellungskontrare Marketingarbeit 
erzeugte Dissonanz kann durch den Parteieintritt reduziert werden. Diese Erklarung ist 
partiell: Die Dissonanztheorie sagt zwar generell Bemiihungen voraus, eine Dissonanz zu 
reduzieren. Die Theorie enthalt auch spezielle Vorhersagen iiber die Veranderungen von 
Meinungen nach einstellungskontraren Verhaltensweisen. Die Theorie sagt aber nicht 
voraus, dass die Dissonanz bei dieser Person durch einen Parteieintritt verringert wird. 
Sie konnte z.B. auch durch eine heimliche Wahlstimme fur die CDU verringert werden. 

Leider wird das Partielle einer Erklarung meist nicht explizit mitgeteilt, es wird nur 
bei genaueren Analysen deutlich. Rezipienten halten deshalb viele Erklarungen 
falschlicherweise fur vollstandig, eindeutig und nicht verbesserungsfahig. 



Gardenfors (1988) 

421 Stegmiiller (1983, S. 940-1074), Schurz (1988a, 1995). Eines dieser pragmatischen 
Erklarungskonzepte werden wir noch in Zusammenhang mit der strukturalistischen 
Theorienkonzeption kennen lernen (siehe Seite 250). 

422 

Bei der deduktiv-nomologischen Erklarung haben wir diese Bedingungen explizit als 
Adaquatheitsbedingungen erwahnt (Kapitel 8.1.2). 





180 



Kapitel 8 



Rudimentdre Erklarungen 

Als rudimentar wird eine Erklarung bezeichnet, bei der die gesetzmaBigen 
Zusammenhange unerwahnt bleiben und stillschweigend als giiltig vorausgesetzt 
werden. Mitunter bleiben auch einige der Antezedensbedingungen unerwahnt. 

0 Die Angriffe von Dirk auf seine Mitschiiler konnen dadurch erklart werden, dass er 
vergeblich versucht hat, die Anforderungen in der Schule zu erfullen. Wenn ein Schuler 
die schulischen Anforderungen nicht erfullen kann, folgt daraus aber nicht zwingend, 
dass er seine Mitschiiler angreift. Die Erklarung des Angriffsverhaltens beruht vielmehr 
auf der impliziten Hypothese „Wenn Frustration, dann Aggression 4 *. AuBerdem flieBen 
in die Erklarung implizite Antezedensbedingungen ein: dass Dirk durch die vergeblichen 
Versuche, die Anforderungen zu erfullen, frustriert ist und dass seine Angriffe 
Aggressionen (und nicht etwa ungeschickte soziale Annaherungen) darstellen. 

Fast alle in der alltaglichen oder wissenschaftlichen Umgangssprache formulierten 
Erklarungen sind in diesem Sinn rudimentar. Dies ist unproblematisch, solange klar 
ist, welche Komponenten fehlen und im Bedarfsfall erganzt werden konnen. 

Erklaru ngsskizzen 

Mitunter werden rudimentare Erklarungen abgegeben, bei denen notwendige Gesetze 
und Antezedensbedingungen noch nicht vollstandig bekannt sind. Die rudimentare 
Erklarung ist dann in eine Erklarungsskizze ubergegangen. 

0 Wenn jemand die Angriffe Dirks auf seine Mitschiiler durch einen Heimaufenthalt im er- 
sten Lebensjahr erklart, wird nur grob angedeutet, auf grand welcher psychologischer Ge- 
setze diese friihkindlichen Erfahrungen zu den spateren Aggressionen fiihren sollen. 

Potenzielle Erklarungen 

Ebenfalls pragmatisch motiviert sind potenzielle oder Wie-moglich-Erklarungen. 
Erklart man einen Sachverhalt deduktiv-nomologisch, zeigt man, dass er aufgrund 
der gultigen Antezedensbedingungen und GesetzmaBigkeiten auftreten muss. Bei 
einer potenziellen Erklarung konnen wir nur Konstellationen von Antezedens- 
bedingungen angeben, unter denen es moglich war, dass der fragliche Sachverhalt 
eintreten kann. Wir wissen aber nicht, ob diese Antezedensbedingungen tatsachlich 
vorgelegen haben. Es konnen deshalb auch noch weitere potenzielle Erklarungen mit 
anderen Antezedensbedingungen und Gesetzesannahmen generiert werden. 

0 Die Exmatrikulation eines Medizinstudenten in Greifswald kann moglicherweise dadurch 
verursacht sein, dass er zu seiner Freundin nach Miinchen ziehen will, dass er kein Blut 
sehen kann, dass er eine Erbschaft gemacht hat usw. 

Potenzielle Erklarungen umfassen oft auch Erklarungsketten, d.h. verschiedene 
mogliche Ablaufe, die zu dem zu erklarenden Sachverhalt gefuhrt haben konnten. 



423 



zu Prtifungen und Modifikationen dieser Theorie: Koeck (1977) 
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Viele erklarende Argumente in der Psychologie sind nur potenzielle Erklarungen. 
Sie zeigen nicht, dass bestimmte Zustande oder Ereignisse eintreten mussen, sondern 
machen nur mehr oder minder deutlich, dass sie eintreten konnen oder dass sie unter 
bestimmten Voraussetzungen zu erwarten sind. Gehalt und Aussagekraft dieser 
unvollstandigen Erklarungen sind natiirlich recht gering. Sie sind kaum widerlegbar 
und es gibt in der Regel etliche genau so substantiierte Alternativerklarungen. 

Pseudo-Erklarungen 

Eine angeblich erklarende Argumentation ist eine Pseudo-Erklarung, wenn sie auf 
falschen Antezedensbedingungen oder unsubstantiierten Gesetzen beruht. 

0 Erklart jemand das aggressive Verhalten von Dirk dadurch, dass sein Vater ein 
stadtbekannter Schlager ist, stellt das eine Pseudo-Erklarung dar, denn die (implizite) 
Gesetzesannahme „Aggressivitat wird vererbt“ ist durch das gegenwartige wissenschaft- 
liche Wissen nicht gestiitzt. 

Eine Pseudo-Erklarung liegt auch dann vor, wenn eine Assoziation falschlicherweise 
als kausale GesetzmaBigkeit interpretiert wird. 

0 Es soli erklart werden, warum ein verstorbener Mann homosexuell war. Eine durch 
empirische Befunde gestutzte Gesetzesannahme besagt, dass der INAH3-Nucleus bei 
heterosexuellen Mannern mindestens doppelt so groB ist wie bei heterosexuellen Frauen 
und bei homosexuellen Mannern. Bei einer gezielten Autopsie des Mannes wird 
tatsachlich festgestellt, dass sein INAH3-Nucleus so klein ist wie bei den meisten Frauen. 
Die Homosexualitat des Mannes kann dadurch nur dann adaquat erklart werden, wenn 
zusdtzlich angenommen wird, dass die Beziehung zwischen NucleusgroBe und 
Homosexualitat nicht nur eine assoziative ist, sondern ein kausale, die auch ceteris 
paribus gilt. 

Bei der Beantwortung psychologischer Warum-Fragen mussen Pseudo-Erklarungen 
mit falschen Antezedensbedingungen, nicht gestiitzten oder nur assoziativen 
Gesetzen vermieden werden. Um derartige Mangel in erklarenden Argumenten 
erkennen und ausraumen zu konnen, mussen wir die wesentlichen Antezedens- 
bedingungen und Gesetzesannahmen stets moglichst offen nennen. 

Zirkelerklarungen 

Ein spezieller Fall von Pseudo-Erklarungen sind Zirkelerklarungen: Erklarungen bei 
denen die Antezedensbedingung aus dem Explanandum folgt. Die Gefahr, dass 
Erklarungen zirkular und damit nichtssagend werden, besteht besonders bei der 
dispositionellen Erklarungen. Zirkular ist eine dispositonelle Erklarung dann, wenn 



Birbaumer & Schmidt (1999, S. 663) 
Zimbardo & Gerrig (1999, S. 94-95) 
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die Zuschreibung einer Disposition D allein durch den zu erklarenden Sachverhalt V 
gerechtfertigt wird. Die angebliche Erklarung ist dann nur eine Etikettierung. 

0 Die Erklarung der Wahl eines mittelschweren Referats durch ein hohes Leistungsmotiv 
ist zirkular, wenn das hohe Leistungsmotiv nur aus der Wahl des Referats gefolgert wird. 

Um zirkulare Erklarungen zu vermeiden, muss die Zuschreibung der Disposition 
aufgrund anderer und von V moglichst unabhangiger empirischer Beobachtungen 
erfolgen. Dies ist immer dann moglich, wenn die Disposition D nicht nur mit V 
verbunden ist, sondern durch Definitionen, Zuordnungsregeln oder Manifestations- 
gesetze auch noch mit mindestens einer anderen beobachtbaren Variablen Z. 

0 Die Erklarung der Referatwahl durch das Leistungsmotiv ist nicht zirkular, wenn das 

426 

Leistungsmotiv durch einen geeigneten psychologischen Test erfasst wird. 



426 



Erfasst werden kann das Leistungsmotiv durch Fragebogen und eine spezielle Form des 
Thematischen Apperzeptionstests (TAT, siehe Heckhausen, 1989, S. 233-244). 





9 Verifizierbarkeit und F alsifizierbarkeit 



Was unterscheidet wissenschaftliche Erkenntnis von anderen, alltaglichen Formen 

der Erkenntnis? Bereits im ersten Kapitel dieses Buches wurde diese Frage 

aufgeworfen. Wie wir in den weiteren Kapiteln wiederholt gesehen haben, wird 

wissenschaftliche Erkenntnis iiblicherweise in Aussagen formuliert: in Annahmen, 

Hypothesen, Gesetzen, Theorien usw. Wir konnen deshalb die Frage nach ihren 

besonderen Charakteristika konkretisieren: In welchen Merkmalen unterscheiden 

sich wissenschaftliche Aussagen von nicht-wissenschaftlichen Aussagen? 

• • 

Nach Uberzeugung der empiristischen Wissenschaftsphilosophen mlissen wissen- 
schaftliche Aussagen verifizierbar sein (Kapitel 9.1): Die Wissenschaftler miissen 
nachweisen, dass ihre Annahmen oder Theorien wahr sind. Karl Popper hat das Veri- 
fikationskriterium zu Recht scharf kritisiert und durch das Kriterium der Falsifizier- 
barkeit ersetzt: Wissenschaftliche Aussagen miissen sich als falsch erweisen konnen 
(Kapitel 9.2). Eine nahere Betrachtung zeigt aber, dass etliche Theorien, die 
unbestritten als wissenschaftlich anerkannt sind, gar nicht falsifizierbar sind. Wissen- 
schaftliche und nicht-wissenschaftliche Aussagen sind offenbar gar nicht eindeutig 
auf Grand ihrer logischen Eigenschaften voneinander zu trennen, sondern nur durch 
die offenen oder stillschweigenden Ubereinkunfte der Wissenschaftler (Kapitel 9.3). 



9.1 Verifizierbarkeit 

Die starksten Bestrebungen, wissenschaftliche von nicht-wissenschaftlichen Aussa- 
gen eindeutig abzugrenzen, stammen von Rudolf Carnap und anderen empiristischen 
Wissenschaftsphilosophen. 427 Sie gehen von der Einteilung der Aussagen in analyti- 
sche und synthetische aus, die eng mit der Unterscheidung zwischen logischer und 
empirischer Wahrheit verbunden ist, die bereits im Kapitel 3.4.3 erlautert wurde. Die 
Begriffe und Unterscheidungen, die im folgenden erlautert werden, sind zusammen- 
fassend in der Abbildung 9.1 dargestellt. 



427 



Die folgende Darstellung beruht teilweise auf Regenbogen & Meyer (1998), Russell 
(1997), Speck (1980) und Stegmiiller (1969). 
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Abbildung 9. 1 : Einteilungen und Abgrenzungen (wissenschaftlicher) Aussagen 

9.1.1 Analytische und synthetische Aussagen 

Die Unterscheidung von analytischen und synthetischen Aussagen geht auf 
Immanuel Kants Kritik der reinen Vernunft aus dem 18. Jahrhundert zuriick. 

• Eine Aussage ist analytisch, wenn ihr Wahrheitswert ausschlieBlich von der 
Bedeutung der Ausdrlicke abhangt, die in ihr vorkommen. 

• Eine Aussage ist synthetisch, wenn ihr Wahrheitswert auch von den 
Sachverhalten abhangt, auf die sie sich bezieht. 428 

Zu den analytischen Aussagen gehoren zum einen die logischen Wahrheiten, das 
heiBt alle Aussagen, die allgemeingultigen logischen Aussageformen entsprechen: 
beispielsweise dem Modus tollens oder einem der korrekten Syllogismen. 



428 

Etwa hundert Jahre vor Kant hat Gottfried Wilhelm Leibniz in ahnlicher Weise 
zwischen Vernunftwahrheit und Tatsachenwahrheit unterschieden. Vernunftwahrheiten 
sind nach Leibniz notwendig, und ihr Gegenteil ist unmoglich. Begrtindet werden sie, 
indem man sie (gegebenenfalls schrittweise) auf einfache Ideen zuriickfuhrt, die 
notwendigerweise wahr sind. Tatsachenwahrheiten sind dagegen nicht notwendig, auch 
ihr Gegenteil ist moglich. Begrtindet werden sie durch die Erfahrung. 
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0 Die Aussage „Wenn alle Depressiven selbstmordgefahrdet sind und alle Schizophrenen 
depressiv sind, dann sind alle Schizophrenen selbstmordgefahrdet 11 ist aufgrund ihrer 
logischen Struktur stets wahr (siehe Seite 85), d.h. sie ist eine analytische Aussage. 

Analytisch sind zum anderen alle Aussagen, deren Wahrheit oder Falschheit sich 
zwangslaufig aus der Definition der verwendeten Begriffe ergibt. Dazu gehoren vor 
allem Aussagen, bei denen der Pradikatbegriff bereits im Subjektbegriff enthalten ist. 
Die Negation einer analytisch wahren Aussage ist analytisch falsch oder, wie man 
auch sagt, kontradiktorisch (d.h. in sich widerspriichlich). 

0 Die Aussage „alle Schizophrenen sind psychisch krank“ ist analytisch wahr, weil die 
Schizophrenic als psychische Krankheit definiert ist. Dagegen ist die Aussage „der 
Schizophrene ist psychisch gesund“ kontradiktorisch oder analytisch falsch. 

Der Wahrheitswert einer analytischen Aussage liegt somit von vornherein eindeutig 

und unabhangig von jeder Erfahrung fest. 

Bei synthetischen Aussagen kann dagegen die Wahrheit oder Falschheit nicht 

• • 

eindeutig aus logischen oder begrifflichen Uberlegungen abgeleitet werden. Wir 
ziehen vielmehr Erfahrungen heran, um eine Entscheidung liber den Wahrheitswert 
einer synthetischen Aussage zu treffen . 430 

0 Synthetische Aussagen sind „Sigmund Freud starb am 23. September 1939 in London 11 

und „niedrig leistungsmotivierte Personen schreiben Misserfolge uberwiegend ihren 

431 

mangelnden Fahigkeiten zu“. 

Theorien, Hypothesen und Befunde der Psychologie und anderer Natur- und 
Sozialwissenschaften sollen Tatsachenwahrheiten sein, also synthetische Aussagen, 
die durch die Ergebnisse von Beobachtungen, Befragungen und Experimenten 



429 Dieser Wahrheitswert muss aber nattirlich nicht alien Personen bekannt sein. 

430 Kant spricht von Erkenntnis a priori , wenn sie unabhangig von jeder Erfahrung ist. 
Erkenntnisse, die auf Erfahrung beruhen, sind a posteriori. Unstrittig ist: Analytizitat 
impliziert Aprioritat (Popper, 1984, S. 94). Das heiBt: Analytische Aussagen sind stets a 
priori. Nach dem Modus tollens folgt daraus, dass a posteriori Aussagen stets 
synthetisch sind: Es gibt keine analytischen Aussagen a posteriori. 

Kants zentrale und umstrittene erkenntnistheoretische These besteht darin, dass 
synthetische Aussagen nicht notwendigerweise a posteriori sind. Vielmehr gibt es nach 
Kant auch synthetische Urteile a priori. Sie drticken sog. transzendentale Erkenntnisse 
aus, d.h. nicht-analytische Erkenntnisse, deren Allgemeingtiltigkeit aber dennoch vor 
jeder Erfahrung sicher ist. Zu ihnen gehoren die Anschauungsformen Raum und Zeit 
sowie das Kausalitatsprinzip (Jedes Ereignis hat eine regelmaBige Ursache). Ohne sie ist 
nach Kant keine mathematische oder naturwissenschaftliche Erkenntnis moglich. Die 
Moglichkeit transzendentaler Erkenntnisse liber die Welt wird von den Vertretern des 
Empirismus und der Analytischen Wissenschaftsphilosophie als „metaphysisch“ 
abgelehnt. Man spricht eher von apriorischen Annahmen , die jeder Erkenntnis zugrunde 
liegen, die aber moglicherweise falsch sind. 

43 1 

Die erste Aussage ist nach Augenzeugenberichten wahr, die zweite wird aufgrund 
zahlreicher Untersuchungsergebnisse als richtig betrachtet (Weiner, 1988, S. 18, 303). 
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gestutzt werden. Es besteht aber der Verdacht, dass ein wesentlicher Teil der 
Erkenntnisse in den empirischen Wissenschaften tatsachlich analytische Aussagen 
sind oder ihnen zumindest nahe kommen (siehe unten Kapitel 1 1.7.3.). 



9.1.2 Abgrenzungskriterium 



Nach Auffassung von empiristischen Wissenschaftsphilosophen gibt es ein 
Kriterium, anhand dessen alle nicht-analytischen Aussagen in wissenschaftlich 
sinnvolle und wissenschaftlich sinnlose eingeteilt werden konnen: 

• Eine nicht-analytische Aussage ist nur dann wissenschaftlich sinnvoll, wenn ihre 
Wahrheit oder Falschheit empirisch eindeutig festgestellt werden kann, das heiBt, 
wenn sie sich im Prinzip mit Hilfe von Beobachtungen vollstandig bestatigen oder 
empirisch verifizieren lasst. 



Alle anderen synthetischen Aussagen werden als „sinnlos“ oder „metaphysisch“ be- 
zeichnet. Man nennt diese Abgrenzung deshalb auch das empirische Sinnkrite- 

434 



num. 

Eine vollstandige Bestatigung einer wissenschaftlichen Aussage oder Theorie T 
mit Hilfe von Beobachtungen bedeutet, dass sie logisch zwingend aus einer Menge 
von Aussagen liber Beobachtungsergebnisse folgt. Nennen wir diese Beobachtungs- 
aussagen Bi bis B n , lautet das empirische Sinnkriterium wie folgt: 



(9 — 1) Bj a ... a B n — ^ T. 



Aussagen liber direkt Beobachtbares, die in einer von der abzuleitenden wissen- 
schaftlichen Aussage T unabhangigen Sprache formuliert sind, bezeichnet Carnap als 
Protokollsatze. Sie mtissen unmittelbar und eindeutig verstandlich sein, und ihre 



432 

Quine (1979, S. 27-42) betont, dass eine klare Trennung zwischen analytischen und 
synthetischen Aussagen nicht moglich sei. Seine Argumente fur die Aufgabe dieser 
Unterscheidung sind aber nicht zwingend (Moore, 1997; Stegmuller, 1987a, S. 221- 
247). Sie legen vielmehr ein Kontinuum nahe: von den empirisch kaum zu 
erschtitternden (analytischen) Aussagen bis zu den fast ausschlieBlich empirisch 
gestiitzten (synthetischen) Aussagen (Kukla, 1989). 

433 Wittgenstein (1922), Carnap (1961), Stegmuller (1974, S. 181-183), Gemes (1998) 

434 Das empirische Sinnkriterium soil zugleich wissenschaftliche und nicht-wissen- 
schaftliche, empirische und metaphysische sowie sinnvolle und sinnlose Aussagen 
voneinander trennen. Damit werden metaphysische und nicht-empirische Aussagen mit 
sinnlosen Aussagen gleichgesetzt. Dagegen hat sich besonders Popper (1965, S. 253- 
292) vehement gewehrt. Er unterscheidet zunachst sinnvolle und sinnlose Aussagen und 
teilt alle sinnvollen Aussagen dann in „wissenschaftliche“ und „metaphysische“ ein. 
DemgemaB spricht er nicht mehr von einem Sinn-, sondern von einem 
Abgrenzungskriterium. Dartiberhinaus kann ein derartiges Abgrenzungskriterium in 
verschiedenen Wissenschaften unterschiedlich positioniert sein. Eine Aussage, die in 
einer Naturwissenschaft nicht wissenschaftlich ist, kann in einer Sozialwissenschaft ihre 
wissenschaftliche Berechtigung haben (vgl. Stegmuller, 1974, S. 183-184). 
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Wahrheit muss mit Sicherheit zu erkennen sein. Protokollsatze sollen also fehlerfrei 
und unbeeinflusst „das Gegebene“ beschreiben. Deshalb kann der Logische 
Empirismus als Positivismus charakterisiert werden. 

Die Verifizierbarkeit als Kriterium fur Wissenschaftlichkeit ist recht alt und sehr 
weit verbreitet. So legte Newton groBen Wert darauf, keine bloBen Hypothesen zu 
veroffentlichen, sondern nur bewiesene Theorien. Bis zur Relativitatstheorie 
Einsteins glaubten die meisten Naturwissenschaftler, „Newton habe Gottes tiefste 
Gesetze entziffert, indem er sie aufgrund der Tatsachen bewiesen habe “. 436 Wenn 
heute in den Medien liber gesellschaftlich relevante Themen (von der Gentechnik bis 
zur Kriminalitat) diskutiert wird, werden ohne Zogern Pro- und Contra-Argumente 
mit der Einleitung „Es ist wissenschaftlich erwiesen, dass vorgebracht. 

In der Wissenschaftsphilosophie hat sich das Verifikationskriterium hingegen 
eindeutig als unhaltbar erwiesen. Auf die wesentlichen Probleme hat insbesondere 
Popper wiederholt hingewiesen. Erstens werden Beobachtungen stets von theoreti- 
schen Vorannahmen beeinflusst. Zweitens miissen Theorien unbegrenzte Allsatze 
sein, deren Ableitung aus Beobachtungen keine logisch zwingende Deduktion, 
sondern allenfalls eine mit Unsicherheit behaftete Induktion ist. 

9.1.3 Voraussetzungen fur Beobachtungen 

Das erste Problem entsteht beim Verifikationskriterium durch die Annahme einer 
voraussetzungslosen, unabhangigen, unmittelbar verstandlichen Sprache, in der die 
Protokollsatze formuliert sind. Diese Annahme ist eindeutig nicht haltbar: Was eine 
Person „beobachtet“, welche Erfahrungen sie macht, ist stets abhangig von der 
Funktion ihrer Sinnesorgane, von ihren bisherigen Erfahrungen, vom begrifflichen 
Geriist, das ihr zur Verftigung steht, von den linguistischen und fachwissenschaft- 
lichen Fahigkeiten, die sie erworben hat, usw . 437 In diesem Sinne sind alle Beobach- 
tungen theoriegetrankt, sie sind Interpretationen im Licht von Theorien. 

Selbst gewohnliche Aussagen liber einzelne Ereignisse sind von Theorien 
durchtrankt, weil in ihnen auch Universalien vorkommen, d.h. allgemeine Begriffe 
fur Klassen von ahnlichen, aber nicht vollig gleichen Objekten, Verhaltensweisen 
oder Eigenschaften. Universalien gehen liber die Bezeichnung von „unmittelbaren 
Erlebnissen“, die ja einmalig und in strengem Sinne nicht wiederholbar sind, hinaus. 



Sprung & Sprung (1987, S. 61) 

Lakatos (1982, S. 2) 

Fodor (1984), Hanson (1958, S. 5-24), Kuhn (1981, S. 137-141), Lakatos (1974b, S.96- 
97), Shapere (1982), Stegmuller (1985, S. 27-30) 

Popper (1984, S. 73; 1994, S. 72), wobei der Begriff der Theorie alle Arten von indivi- 
duellen Vorerfahrungen und Erwartungen mit umfasst. 
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Sie erfordern Konzepte oder „Theorien“ (wiewohl eines relativ geringen Allgemein- 
heitsgrades) dariiber, was zur jeweiligen Klasse gehort und was nicht 439 

9 Die Aussage „Sigmund Freud starb am 23. September 1939 in London 44 ist nur auf den 
ersten Blick ein unproblematischer Protokollsatz. Zum einen gibt es unterschiedliche 
Kriterien dafiir, wann das Leben eines Menschen tatsachlich endet: beim Erloschen aller 
hoheren Gehirnfunktionen, beim definitiven Herz- und Kreislaufstillstand oder gar erst 
beim Ende des Zellstoffwechsels. Zum anderen gibt es unterschiedliche politische, 
historische und juristische Kriterien dafiir, welche Gebiete zu „London“ gehoren. 

9 Die Aussage einer Schulpsychologin „Lena hat sich in dieser Stunde aggressiv zu Oliver 
verhalten 44 ist kein unproblematischer Protokollsatz: Welche Verhaltensweisen als 
aggressiv klassifiziert werden, ist in der Psychologie nicht eindeutig festgelegt und hangt 
wesentlich von den theoretischen Voreinstellungen ab. 

Eine substanzwissenschaftliche Rechtfertigung erhalt die philosophische Position 
von der Theoriegetranktheit aller Beobachtungen durch gestaltpsychologische, 
kognitive und soziale Ansatze der Wahrnehmungspsychologie. Danach ist jede 
Wahrnehmung ein aktiver Prozess: eine Kombination von auBen aufgenommener 
und bereits im System vorhandener Information, eine Interpretation von sensorischen 
Daten auf der Basis der jeweiligen vorhandenen Kenntnisse und Erwartungen, oft 
sogar eine aktive Suche nach passender Information. Dies kann durch zahlreiche 
empirische Untersuchungen in tiberzeugender Weise demonstriert werden. 440 

9.1.4 Ableitung von Theorien aus Beobachtungen 

Wenn wir das Verifikationskriterium (9-1) voll akzeptieren, kann eine Theorie oder 
Hypothese T keinen groBeren Gehalt besitzen als die Konjunktion von Beobach- 
tungsaussagen B! a ... a B n , aus der sie logisch abgeleitet worden ist. Eine Theorie 
kann somit nach logisch-empiristischen Kriterien nicht mehr sein als die Zusammen- 
fassung der zugrunde liegenden Beobachtungsaussagen. Da man immer nur eine 
endliche Anzahl von Beobachtungen anstellen kann, waren Theorien damit stets nur 
Aussagen iiber begrenzte Mengen von Sachverhalten. 

9 Eine psychologische Theorie des Gedachtnisses beschreibt nach dem empiristischen 
Sinnkriterium genau das Lernen, Erinnern und Vergessen, das die Versuchspersonen in 
den bisherigen Experimenten gezeigt haben. Sie wiirde aber nichts aussagen iiber das 
Gedachtnis anderer Personen in gleichartigen Experimenten oder iiber das Gedachtnis in 
alltaglichen Situationen. 



Popper (1965, S. 387; 1994, S. 61, 374-381). Trotzdem kann es natiirlich Beobach- 
tungssatze geben, die die gerade gepriiften Theorien nicht voraussetzen und deshalb zur 
unabhangigen vergleichenden Bewertung verschiedener Theorien herangezogen werden 
konnen (Radnitzky, 1980, S. 326). 

Bruner (1957), Graumann (1966), Gordon (1989), Kebeck (1994) 
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Insbesondere Popper hat darauf hingewiesen, dass es nicht ausreichend ist, Theorien 
als Zusammenfassungen von Beobachtungsaussagen zu betrachten. Wissenschaft- 
liche Theorien und Hypothesen und insbesondere die sog. Naturgesetze sollen 
vielmehr unbeschrankt fiir alle moglichen vergangenen, gegenwartigen und 
zukunftigen Situationen und Zeiten gliltig sein. Sie miissen deshalb die logische 
Form von Allaussagen liber unendliche Objektmengen haben. 441 

Nicht-Verifizierbarkeit von Theorien 

Wissenschaftliche Theorien entsprechen damit immer unbegrenzten Allsatzen. 
Beobachten konnen wir stets nur eine endliche Menge von Fallen, so dass Aussagen 
liber Beobachtungsergebnisse immer Aussagen liber endliche Mengen sind. Der 
Gehalt von Theorien geht also stets liber den Gehalt von Beobachtungsaussagen 
hinaus. Deshalb kann eine Theorie nie logisch aus einer Menge von Beobachtungs- 
aussagen abgeleitet werden, denn der Gehalt der Konklusion eines deduktiv- 
logischen Argumentes kann nicht liber den Gehalt der Pramissen hinausgehen. Nach 
dem Verifikationskriterium des logischen Empirismus waren damit alle Theorien, die 
unbegrenzten Allsatzen entsprechen, wissenschaftlich nicht sinnvoll. Das Verifika- 
tionskriterium ist also definitiv zu eng und damit nicht akzeptabel. 

Popper ersetzt deshalb das Verifikationskriterium durch das Kriterium der 
Falsifizierbarkeit. 

Die Logischen Empiristen hielten jedoch am Ziel der Verifikation fest und 
interpretierten die Ableitung von Theorien aus Beobachtungen nicht als deduktiven, 
sondern als induktiven Schluss. In einer abgeschwachten Form des Verifikations- 
kriteriums muss dann nur noch gefordert werden, dass eine wissenschaftliche 
Aussage empirisch bestdtigungsfdhig sein muss. Sie muss also so formuliert sein, 
dass Aussagen liber Beobachtbares sie stiitzen konnen. AuBerdem wurde versucht, 
ein formales System zur Rechtfertigung von induktiven Schliissen und Ableitung 
von StiitzungsmaBen zu entwickeln. 442 Popper hielt diesen Ausweg nicht fiir 
gangbar, da induktive Schllisse seiner Auffassung nach prinzipiell nicht zu 
rechtfertigen sind. 



9.2 Falsifizierbarkeit 

Da das Verifikationskriterium der Logischen Empiristen aus den im vorigen Kapitel 
genannten Griinden nicht haltbar ist, machte Popper nicht die prinzipielle 
Verifizierbarkeit, sondern die prinzipielle Widerlegbarkeit (die sog. Falsifizierbar- 
keit) zum Kriterium fiir die Abgrenzung wissenschaftlicher und nicht-wissenschaft- 
licher Aussagen: 



441 

442 



Popper (1994, S. 35), vgl. oben 7.1.3 und 7.1.4 
Stegmiiller (1969, S. 406-41 1), siehe Kapitel 4.3 
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• Em theoretisches System wird dann und nur dann als wissenschaftlich bezeichnet, 
wenn es Aussagen macht, die mit Beobachtungen im Widerstreit stehen konnen. 

Kurz zusammengefasst: Em empirisch-wissenschaftliches System muss an der 
Erfahrung scheitern konnen. 443 

Popper kam zu dieser Erkenntnis, als ihm der wesentliche Unterschied zwischen 
physikalischen Theorien wie denen von Newton und Einstein auf der einen Seite und 
psychoanalytischen Theorien wie denen von Freud und Adler auf der anderen Seite 
deutlich wurde. Mit Adlers Theorie beispielsweise ist jedes menschliche Verhalten 
vereinbar, so dass sie standig bestatigt wird. Einsteins Theorie hingegen steht mit 
bestimmten moglichen und ohne diese Theorie sogar erwarteten Beobachtungs- 
ergebnissen im Widerspruch. 444 

Theorie und Basissatze 

Nach dem Falsifizierbarkeitskriterium muss also fur jede Theorie T mindestens eine 
Beobachtungsaussage B existieren, aus der die Falschheit von T folgt: 

(9-2) 3B: B — > — iT. 

Dies ist genau dann der Fall, wenn die Theorie T die Negation eines Beobachtungs- 
satzes B impliziert, denn nach dem Modus tollens (siehe Kapitel 3.4.1) ist die 
Forderung (9-2) Equivalent mit dem folgenden Ausdruck: 

(9-3) 3B: T — > — iB. 

Um falsifizierbar zu sein, muss eine wissenschaftliche Theorie also bestimmte 
beobachtbare Ereignisse „verbieten“. Treten sie dennoch auf, folgt daraus die Falsch- 
heit der Theorie, sie kann falsifiziert werden. Eine Beobachtungsaussage B, die einen 
derartigen theoriekontraren Sachverhalt beschreibt, wird als Basissatz bezeichnet. 

Im einfachsten Fall besteht eine Theorie aus einer einzigen Gesetzesaussage. Sie 
entspricht damit einer implikativen Allaussage der Form 445 

(9-4) VxeM: F(x) — » A(x) Theorie T 

In der wissenschaftlichen Umgangssprache werden derartige Gesetzesannahmen 
durch „Wenn-dann-Satze“ ausgedruckt oder durch Satze, die in derartige Kondi- 
tionalsatze uberfiihrt werden konnen. 



Popper (1994) sowie Albert (1980b), Gadenne (1984, 1994a), Seiffert & Radnitzky 
(1989), Westermann (1987c, Abschn. 2.3) 

444 Diese von Popper (1965, S. 33-36) vollzogene Ausgrenzung psychoanalytischer 
Theorien scheint aus heutiger Sicht nicht adaquat zu sein. Zum einen verfiigen auch als 
mustergiiltig anerkannte physikalische Theorien iiber einen nicht-falsifizierbaren Kern- 
bereich (siehe Kapitel 11.7.3). Zum anderen konnte man auch aus der Psychoanalyse 
Konsequenzen ableiten und streng prtifen (Grunbaum, 1997). 

445 siehe oben Kapitel 7.1 
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0 „Wenn Frustration, dann Aggression" ist ein Konditionalsatz, die Annahme „Misserfolg 
fiihrt zu Anspruchsniveausenkung" kann in einen Konditionalsatz umgeformt werden. 

Jede Allaussage ist definitionsgemaB gleich einer Konjunktion von Einzelfall- 
aussagen. Bei der Implikation (9-4) haben sie die Form 

(9-5) F(p) -A A(p) Einzelfallaussage T p 

Dabei steht p fiir eine bestimmte Person in einer bestimmten Situation. 

Jede Implikation ist nur in genau einem Fall falsch (siehe Wahrheitstafel in 
Tabelle 3.2): Wenn die Pramisse wahr und die Konklusion falsch ist. Die Einzelfall- 
aussage T p in (9-5) ist also genau dann falsch, wenn F(p) wahr und A(p) falsch ist. 
Diese Beobachtungsaussage stellt einen theoriekontraren Basissatz dar: 

(9-6) F(p) a — iA(p) Basissatz B 

Wenn es prinzipiell moglich ist, dass der durch B beschriebene Sachverhalt eintritt, 
ist T falsifizierbar. 

0 Bei der Frustrations-Aggressions-Theorie beschreibt ein theoriekontrarer Basissatz die 
Beobachtung, dass eine bestimmte Person fmstriert worden ist und nicht aggressiv 
reagiert. Da eine derartige Beobachtung moglich ist, ist die Theorie falsifizierbar. 

Falsifizierbarkeit als Konvention 

Ob eine Theorie falsifizierbar ist, hangt also davon ab, ob beobachtbare Ereignisse 
denkbar sind, die einer Folgerung aus der Theorie widersprechen. Die Identifikation 
theoriekontrarer Beobachtungen ist allerdings in den meisten Fallen nicht so einfach, 
wie es zunachst den Anschein haben mag. Dafiir gibt es mehrere Griinde, die wir in 
den folgenden Kapiteln 9.2.1 bis 9.2.3 betrachten werden: 

• die mogliche Falschheit aller Beobachtungsaussagen, 

• die Notwendigkeit von Zusatzannahmen bei der Ableitung von Beobachtungs- 
aussagen aus Theorien und 

• der probabilistische Charakter von Theorien. 

Diese Uberlegungen fiihren in jedem Fall zu dem Ergebnis, dass die Falsifizierbar- 
keit keine eindeutig feststellbare Eigenschaft einer Theorie ist. Sie ist vielmehr eine 

Eigenschaft, die eine Theorie erst per Konvention bekommt, d.h. durch Entschei- 

• • 

dungen und Ubereinkiinfte. Damit ist die Falsifizierbarkeit kein logisch eindeutiges 
Kriterium zur Abgrenzung wissenschaftlicher Theorien mehr. 

9.2.1 Fallibilitat von Basissatzen 

Ein Basissatz ist nach Popper eine Aussage liber einen beobachteten Sachverhalt, der 
die Form einer singularen Existenzaussage hat („An der Raum-Zeit-Stelle x gibt es 
...“) und das Resultat eines ernsthaften Versuchs zur Falsifikation der Theorie ist. 
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Im Unterschied zu den Logischen Empiristen ist Popper davon uberzeugt, dass 
auch Aussagen liber Beobachtungen von Vorannahmen und Erwartungen abhangen 
und stets liber das hinausgehen, was wir durch unmittelbare Erfahrungen sicher 
wissen konnen (siehe oben Kapitel 9.1.3). Auch Basissatze sind deshalb fallibel, d.h. 
man kann nie sicher sein, ob sie wahr oder falsch sind. Basissatze haben somit 
hypothetischen Charakter, sie sind aber deutlich konkreter als die zugrunde liegende 
Theorie. 

Grundsatzlich kann man Basissatze durch Ableitung noch speziellerer Satze 
tiberpriifen. Damit ergibt sich aber eine prinzipiell unendliche Begriindungskette. Sie 
kann nur dadurch abgebrochen werden, dass man an einer Stelle auf weitere 
Prtifungen verzichtet und den entsprechenden Basissatz einfach akzeptiert. 
Idealerweise sollte dies ein Basissatz sein, iiber dessen Annahme sich alle 
sachverstandigen Personen einig sind. Tatsachlich wird in Forschungsprozessen die 
Giiltigkeit empirischer Ergebnisse meist ohne weitere Uberpriifung akzeptiert. 

Falsifizierbarkeit und Fallibilitat 

Auf jeden Fall flihren die Popperschen Uberlegungen zu der Erkenntnis, dass es in 
der Wissenschaft keine absoluten Wahrheiten geben kann. Da man jedes empirische 
Ergebnis anzweifeln kann, gibt es keinen logisch zwingenden Nachweis der Falsch- 
heit einer Theorie. Die Falsifizierbarkeit einer Theorie bedeutet nicht, dass ihre 
Falschheit erwiesen werden kann. 

Die Falsifizierbarkeit einer Theorie als Kriterium fiir ihre Wissenschaftlichkeit 

• • 

muss deshalb durch Beschluss und Ubereinkunft entstehen: Man legt von vornherein 
bestimmte mogliche Sachverhalte fest, die zur Falsifikation der Theorie fiihren, falls 
sie tatsachlich beobachtet werden. Da es gute Griinde geben mag, diese Fest- 
setzungen zu einem spateren Zeitpunkt zu revidieren, kann auch die Falsifikation 
einer Theorie nie als endgliltig betrachtet werden. 

Worin kann der Erkenntnisgewinn in einer Wissenschaft bestehen, wenn nicht nur 
ihre Theorien und Hypothesen fallibel sind, sondern auch ihre empirische Basis, 
wenn es also weder definitiv wahre oder falsche Theorien noch unumstoBliche 
Beobachtungstatsachen gibt? 

Ein sinnvolles und erreichbares Ziel der wissenschaftlichen Forschung besteht 
darin, Theorien immer mehr zu verbessern, so dass sie mit immer mehr 
Beobachtungen ubereinstimmen, das heiBt sie sich immer starker an die Wahrheit 
annahern. Um eine vorliegende Theorie zu verbessern, muss man ihre Schwach- 
stellen entdecken und ausraumen. Dies ist am besten moglich, wenn die Theorie 
strengen Prtifungen unterzogen wird, wenn versucht wird, sie zu falsifizieren. Auf 
die Vor- und Nachteile einer derartigen Falsifikationsmethodologie werden wir 
spater im Kapitel 10.2 zuriickkommen. 
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9.2.2 Notwendigkeit von Zusatzannahmen 

Oben haben wir festgestellt, dass aus einer Theorie T die Negation eines Basissatzes 
B ableitbar sein muss, damit die Theorie falsifizierbar ist (9-3). Dies war jedoch eine 
vorlaufige Vereinfachung: Fur die Ableitung von beobachtbaren Konsequenzen aus 
einer Theorie sind in aller Regel zusatzliche Annahmen notwendig. Dazu gehoren 
vor allem Annahmen dariiber, dass sich die theoretischen Konzepte tatsachlich in 
den konkret beobachtbaren Sachverhalten manifestieren und dass keine anderen 
Einflussfaktoren vorliegen (Ceteris-paribus-Bedingung). 

0 Eine Studentin versucht in der Universitatsbibliothek, einen Fachartikel zu kopieren, alle 
Kopiergerate sind jedoch defekt. Nach der Frustrations-Aggressions-Theorie erwarten 
wir, dass sie auf diese Frustration aggressiv reagiert. Wir beobachten jedoch, dass sie 
frohlich lachend das Gebaude verlasst. 

Dies spricht nur auf den ersten Blick gegen die Frustrations-Aggressions-Theorie. Die 
Vorhersage von Aggression fur die konkrete Frustrationssituation ist namlich nur unter 
bestimmten Zusatzannahmen zwingend. Zum einen muss der Defekt der Kopierer fiir die 
Studentin tatsachlich eine ausreichend starke Frustration darstellen (und nicht etwa ein 
willkommener Vorwand, das Studium des Artikels zu vermeiden). Zum anderen diirfen 
keine anderen, starker wirksamen Einfliisse vorliegen (wie eine gerade sehr gut 
bestandene Priifung, die zu einer lang anhaltenden und kaum zu erschiitternden Hoch- 
stimmung fiihrt). AuBerdem konnte es sein, dass die Aggression verdeckt oder spater 
auftritt. 

Aus dem beobachteten Verhalten der Studentin folgt damit nicht eindeutig, dass die 
Frustrations-Aggressions-Theorie falsch ist. 

Zusatzannahmen und Falsifizierbarkeit 

Die Notwendigkeit derartiger Zusatzannahmen hat schwerwiegende Konsequenzen 
fiir das Falsifizierbarkeitskriterium. Wenn die Negation eines Basissatzes nicht aus 
einer Theorie T allein ableitbar ist, sondern nur aus der Theorie zusammen mit 
geeigneten Zusatzannahmen, ist die Theorie T nicht mehr logisch zwingend liber den 
Basissatz B falsifizierbar. Bezeichnen wir die Zusatzannahmen mit Z l5 ..., Z m , gilt 
statt der einfachen Beziehung T — » — iB in (9-3) der Ausdruck 

(9 — 7) (T a Zj a ... a Z m ) — ^ iB. 

• • 

Uber den Modus tollens ergibt sich daraus 

(9—8) B — > — |(T A Z\ A ... A Zm), 

was nach der Regel von deMorgan 446 aquivalent ist zu 

(9—9) B — > (— iT v — iZ i v ... v — iZ m ). 



446 



siehe FuBnote 180, Seite 79 
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Aus dem Basissatz B folgt also nicht zwangslaufig, dass die Theorie T falsch ist, 
sondern nur, dass die Theorie oder mindestens eine der Zusatzannahmen falsch ist 
(oder dass sowohl Theorie wie Zusatzannahmen falsch sind). 

Falsifizierbarkeit trotz Zusatzannahmen 

Eine naheliegende Konsequenz aus diesen Uberlegungen konnte darin bestehen, 
wissenschaftliche Theorien als nicht falsifizierbar zu betrachten. Die Kritischen 
Rationalisten lehnen eine derartige Immunisierung von Theorien jedoch strikt ab, 
weil fur sie die Falsifikation der einzigen Weg zum Erkenntnisgewinn ist. 

Sie empfehlen vielmehr, die verwendeten Zusatzannahmen „per Konvention“ zu 
akzeptieren: als Hintergrundhypothesen, die selbst streng iiberpruft werden konnen 
bzw. sich bereits in strengen Priifungen bewahrt haben. Diese Position ist allerdings 
mit zwei Problemen belastet. 

Erstens kann Poppers Anspruch nicht langer aufrecht erhalten werden, dass seine 
Falsifikationsmethodologie keine induktiven, sondern nur deduktive logische 
Schlusse beinhaltet: Wenn angenommen wird, dass friiher bewahrte Hilfshypothesen 
auch im Falle einer gegenwartigen Theorienprufung gelten, so ist das eine 
Erwartung, die in friiherer Erfahrung begriindet ist, also ein induktives Argument 
(eine empirische Vermutung, siehe Kapitel 4.2.3). 

Zweitens sind vide Arten von Hilfshypothesen gar nicht streng empirisch 
uberpriifbar. Dies gilt insbesondere fur Hilfshypothesen, die sich auf einzelne 
Personen oder Objekte beziehen, an denen die Theorie empirisch iiberpruft werden 
soil. 

0 Es ist nicht moglich, fur eine einzelne Person streng zu priifen, ob ein bestimmtes 
Ereignis ein bestimmtes MaB an Frustration erzeugt hat. 

Auch die Wirksamkeit anderer Einflussfaktoren kann streng genommen nie 

ausgeschlossen werden. 447 Aus diesem Grunde werden wissenschaftliche Theorien 

meist iiberpruft, indem man nicht Einzelfalle betrachtet, sondern verschiedene Falle 

unter moglichst gleichartigen Bedingungen untersucht (siehe unten Kapitel 14). 

• • 

Nach diesen Uberlegungen ist die Falsifizierbarkeit keine rein logische 
Eigenschaft einer Theorie, liber die mit Sicherheit entschieden werden kann. Die 
Falsifizierbarkeit ist vielmehr ein Merkmal, das Theorien durch Beschluss 
zugewiesen wird: Man trifft die Entscheidung, Theorien als falsifizierbar zu 



447 Popper betont ahnliches fur physikalische Theorien und Gesetze: „Wir konnen von 
keinem einzigen Korper in der Natur direkt zeigen, dass er sich geradlinig fortbewegt, 
wenn keine Kraft auf ihn einwirkt, oder dass zwischen ihm und einem anderen Korper 
eine Anziehung nach dem Gravitationsgesetz wirkt. Alle diese Theorien beschreiben 
das, was wir als strukturelle Eigenschaften der Welt bezeichnen konnen, und ... die 
Schwierigkeit ... liegt ... in der Frage, wie man nachweisen kann, dass das Gesetz auch 
nur in einem Fall gilt; denn die Beschreibung und Uberprlifung jedes einzelnen Falles 
setzt ihrerseits schon Strukturtheorien voraus“ (Popper, 1994, S. 376-377). 
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betrachten, damit man im Falle einer tatsachlichen Falsifikation aus seinen Fehlern 
lernen kann. 

9.2.3 Wahrscheinlichkeits- und Existenzaussagen 

Die Forderung, dass wissenschaftliche Theorien falsifizierbar sein miissen, ist 
zwangslaufig mit der Annahme verbunden, dass alle wissenschaftlichen Theorien die 
Form implikativer Allaussagen haben. Andere Arten von Theorien miissen von 
vornherein als nicht-wissenschaftlich klassifiziert werden, da sie aus logischen 
Griinden nicht falsifizierbar sind: Theorien, die nicht deterministisch, sondern 
probabilistisch formuliert sind, und Theorien, die nicht nur All-, sondern auch 
Existenzaussagen enthalten. (Beide Eigenschaften konnen natiirlich auch kombiniert 
auftreten.) Bei einigen Theorien tritt ihr probabilistischer oder existentialistischer 
Charakter deutlich in ihrer sprachlichen Formulierung zu Tage, bei anderen ist diese 
Eigenschaft durch die Formulierung verdeckt. 

Existenzaussagen 

Pragnante Beispiele fur offene Existenzaussagen finden sich in der Physik, wenn die 
Existenz von Himmelskorpern, subatomaren Teilchen oder anderen Objekten mit 
bestimmten Eigenschaften vorhergesagt wird und danach entsprechend versucht 
wird, diese Objekte nachzuweisen. In der Psychologie gibt es etliche Aussagen, in 
denen die Existenz bestimmter Sachverhalte behauptet wird. 

0 Nach Klaus und Kendall gibt es unmittelbar nach der Geburt eine sensible Phase, 
wahrend der es fur eine optimale Entwicklung erforderlich ist, engen Korperkontakt mit 
dem Saugling zu halten. 

0 Aus psychoanalytischer Sicht ist die Ursache einer generalisierten Angststorung ein 
unbewusster Konflikt zwischen dem Ich und Triebregungen des Es. 449 
0 Die Netzhaut verfiigt iiber drei unterschiedlich farbempfindliche Sensorentypen. 450 

Viel haufiger sind jedoch verdeckte Existenzaussagen. Da psychologische Theorien 
praktisch nie Zeitpunkt und -dauer eines vorhergesagten Ereignisses (also z.B. der 
Aggression nach einer Frustration) spezifizieren, behaupten sie nur die Existenz 
mindestens eines Zeitpunktes, zu dem dieses Ereignis stattfindet. 

Probabilistische Aussagen 

Unabhangig von Zustandekommen und Interpretation (vgl. Kapitel 7.1.5) stellen 
probabilistische Theorien und Hypothesen ein schwieriges Problem fiir das 
Falsifizierbarkeitskriterium dar. Probabilistische Aussagen sind streng genommen 
weder verifizierbar noch falsifizierbar, denn Aussagen iiber Wahrscheinlichkeiten 



Rauh (1995, S. 183) 

Davison & Neale (1996, S. 162) 
Birbaumer & Schmidt (1999, S. 382) 
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konnen mit keinem Satz iiber endlich viele Beobachtungen in logischem Wider- 
spruch stehen. 

0 Aufgrund vorliegender amerikanischer Befunde stellen wir die Hypothese auf, dass auch 
in Europa eine Person mit einer Wahrscheinlichkeit von 0,44 an Schizophrenic erkrankt, 
wenn beim eineiigen Zwillingsbruder bereits eine Schizophrenic ausgebrochen ist (siehe 
oben Seite 176). Es werden 100 Manner untersucht, deren eineiiger Zwillingsbruder 
schizophren ist. Es stelle sich heraus, dass keiner dieser Manner in seinem Leben jemals 
schizophren wird. Dieses Ergebnis lasst berechtigte Zweifel an der Gultigkeit der 
Hypothese mit der Erkrankungswahrscheinlichkeit 0,44 zu. Aus dem Ergebnis folgt aber 
nicht zwingend, dass unsere Hypothese falsch ist, denn unter den nachsten untersuchten 
100 Zwillingspaaren konnten genau 88 sein, bei denen beide Briider schizophren sind. 

Popper schlieBt probabilistische Hypothesen dennoch nicht aus der Menge der 

wissenschaftlichen Aussagen aus, denn ihr wissenschaftlicher Wert und Nutzen ist 

unbestreitbar und die grundlegendsten Naturprozesse sind seiner Auffassung nach 

objektiv probabilistisch. Vielmehr empfiehlt er, durch Entscheidung, Beschluss oder 

Konvention Kriterien fiir eine „praktische Falsifikation“ zu schaffen: Empirische 

Ergebnisse, die bei Gultigkeit der gepriiften probabilistischen Hypothese sehr 

unwahrscheinlich sind, werden zum Anlass genommen, die Hypothese als unbrauch- 

bar zu verwerfen. Diese Entscheidung ist aber nicht logisch zwingend und kann 

aufgrund weiterer Erkenntnisse auch revidiert werden. 

Die iibliche Anwendung von Signifikanztests in den Wissenschaften liefert 

• • 

derartige konventionelle Kriterien fur die empirische Uberpriifung von (probabilisti- 
schen und deterministischen) Hypothesen an Gruppen von Personen oder anderen 
Beobachtungseinheiten (siehe dazu Kapitel 15.3.6). 

0 Bei der Untersuchung von Mannern mit schizophrenen Zwillingsbriidern kann man 
beispielsweise festlegen, dass der tatsachliche Prozentsatz signifikant und mindestens um 
den Betrag eines mittelgroBen Effektes (siehe unten Kapitel 15.4) von den erwarteten 
44% abweichen muss. Nach der Untersuchung der ersten 100 Manner miisste unsere 
Hypothese danach falsifiziert und ein Erkrankungsrisiko bei 100% angenommen werden. 
Wiirden bei der Untersuchung weiterer 100 Mannern tatsachlich 88 Krankheitsfalle 
auftreten, wiirde die urspriingliche Hypothese wieder als sehr gut bewahrt gelten. 

Sinnvoll festzulegen sind derartige Kriterien fiir eine praktische Falsifikation einer 
probabilistischen Hypothese jedoch nur, wenn die Hypothese auf zahlreiche Falle 
bezogen wird. Eine probabilistische Hypothese iiber ein einzelnes Ereignis ist auch 
„praktisch“ nicht falsifizierbar. Auch deshalb werden zur empirischen Priifung von 
Hypothesen in der Psychologie in aller Regel zahlreiche Personen unter gleichen 
Bedingungen untersucht. 
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9.3 Pragmatische Abgrenzung 

Carnap und Popper haben versucht, Kriterien fur die Abgrenzung wissenschaftlicher 

Aussagen aufzustellen, die logisch formuliert werden konnen und im Prinzip sogar 

„extern“, d.h. unabhangig von Kenntnissen im speziellen Fachgebiet angewendet 

werden konnen. 451 Ihre anfanglich sehr prazisen Kriterien haben sich als zu starr 

erwiesen und wurden zunehmend aufgeweicht und uminterpretiert. Zumindest 

gemessen am urspriinglichen Ziel, sinnvolle wissenschaftliche Aussagen von sinn- 

loser Metaphysik oder zumindest doch von nicht-wissenschaftlichen Aussagen 

trennen zu konnen, muss das Programm zur Formulierung eines empirischen Sinn- 

oder Abgrenzungskriteriums als gescheitert angesehen werden. Zwar mag es viele 

unstreitige Beispiele sowohl fur wissenschaftliche wie fur nicht-wissenschaftliche 

• • 

Aussagen geben, aber es gibt eben auch einen nicht zu vernachlassigenden Uber- 
gangsbereich. Eine Abgrenzung von wissenschaftlichen und nicht-wissenschaft- 
lichen Aussagen scheint deshalb allenfalls nach pragmatischen Kriterien moglich zu 
sein. 

Nach skeptizistischen Auffassungen wie dem „erkenntnistheoretischen Anarchis- 
mus“ von Paul Feyerabend gibt es iiberhaupt keine Moglichkeit, verschiedene Aus- 
sagensysteme hinsichtlich ihrer wissenschaftlichen Qualitat vergleichend zu 
beurteilen. Sein „anything goes“ ist zum beriichtigten Schlagwort gegen alle Gute- 
kriterien fur die Gewinnung von Erkenntnissen geworden. 452 Die Horoskope der 
Astrologie waren danach genau so viel Wert wie geprlifte und bewahrte Theorien der 
Personlichkeitspsychologie, die Regeln der Medizinmanner hatten die gleiche Giite 
wie die wissenschaftlich gestutzte Medizin. 453 

Pragmatiker wie Thomas Kuhn sehen allein die Moglichkeit, dass die Mitglieder 
der wissenschaftlichen Gemeinschaft selbst („intern“) entscheiden, welche Theorien 
ihnen akzeptabel erscheinen. Dieser pragmatische Aspekt wird auch in der Metho- 
dologie der Forschungsprogramme von Imre Lakatos betont, die auf der Paradigmen- 
konzeption Kuhns aufbaut und sie mit Poppers Falsifikationsmethodologie versoh- 
nen soil. Diese pragmatischen Ansatze werden im folgenden dargestellt. 

Wolfgang Stegmuller hat innerhalb der strukturalistischen Wissenschaftstheorie 
gezeigt, wie pragmatische Gesichtspunkte systematisch in der Wissenschaftstheorie 
beriicksichtigt werden konnen, ohne in erkenntnistheoretischen Anarchismus 
abzugleiten, d.h. ohne das Ziel aufzugeben, Wissenschaft als rationales Unternehmen 
zu rekonstruieren und gegen nicht-wissenschaftliche Erkenntnisformen abzugrenzen 
(siehe unter Kapitel 11.9). 



Lakatos (1974a) 

452 Feyerabend (1976), Seiffert & Radnitzky (1989, S. 58-61) 

453 

Beschreibungen und historische Einordnungen verschiedener Erkenntniswege: Eberhard 
(1987), Breuer (1988), Kriz, Luck & Heidbrink (1990) 
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9.3.1 Wissenschaftliche Gemeinschaften 

Die wissenschaftstheoretische Konzeption von Kuhn beruht auf umfangreichen 
historischen und soziologischen Analysen der Entwicklung der Physik und 
Chemie. 454 Etliche der von ihm herausgearbeiteten Charakteristika dieser klassischen 
Naturwissenschaften finden sich auch in der Psychologie wieder, es gibt aber auch 
einige wesentliche Unterschiede. 

Eine entscheidende Rolle im Prozess der wissenschaftlichen Erkenntnis- 
gewinnung kommt nach Kuhn den wissenschaftlichen Gemeinschaften zu. Jede 
wissenschaftliche Gemeinschaft ist eine Spezialistengruppe, d.h. eine mehr oder 
minder groBe Gruppe von Personen, die eine bestimmte Art der Forschung betreiben. 
Charakterisiert ist jede wissenschaftliche Gemeinschaft dadurch, dass ihre Mitglieder 
relativ intensiv miteinander liber ihre Forschungsansatze und -ergebnisse 
kommunizieren und dass ihre fachlichen Kenntnisse, Untersuchungsmethoden, 
Meinungen und Beurteilungskriterien relativ stark ubereinstimmen. 

Formal konnen wir eine konkrete wissenschaftliche Gemeinschaft WG als 
Untermenge der Menge der irgendwann einmal wissenschaftlich tatigen Personen 
charakterisieren: WG c WISS. Zusatzlich ist es fur die prazise Analyse wissen- 
schaftlicher Prozesse hilfreich, die zu einem bestimmten Zeitpunkt oder Zeitraum t 
zur WG gehorenden Personen gesondert als spezielle Untermenge zu kennzeichnen: 
WG t cz WG. Bezieht sich t auf einen umrissenen Entwicklungszeitraum, kann man 
WG t als eine wissenschaftliche Generation bezeichnen. 455 

Um die gegenwartigen Mitglieder einer konkreten wissenschaftlichen Gemein- 
schaft zu identifizieren, konnen unterschiedliche sozialwissenschaftliche Methoden 
angewendet werden. Man kann zum Beispiel betrachten, welche Personen in 
wissenschaftlichen Veroffentlichungen zitiert werden, sich ihre neuesten Manu- 
skripte regelmaBig zusenden, die gleichen Kongressvortrage besuchen, als Gutachter 
fur For s chung sprojekte, Publikationen, Habilitationen oder Berufungen bestellt 
werden und so fort. Je nach Wahl der konkreten Kriterien konnen sehr kleine und 
stark spezialisierte und sehr groBe und vielfaltige wissenschaftliche Gemeinschaften 
identifiziert werden. 

0 Spezielle wissenschaftliche Gemeinschaften beschaftigen sich mit der Arbeitszufrieden- 
heit in Verwaltungen oder mit Coping-Strategien von Frauen nach Krebsoperationen. 

0 Die groBe Gemeinschaft aller psychologischen Forscher besucht regelmaBig die groBen 
nationalen und internationalen Kongresse, auf denen neben einem weiten Spektrum an 
speziellen Forschungsthemen auch iibergreifendere Fragen behandelt werden. 

Zwischen beiden Extremen konnen zahlreiche wissenschaftliche Gemeinschaften 
unterschiedlichen Allgemeinheitsgrades bestehen. 



Kuhn (1974, 1977a, 1981, 1983), Hoyningen-Huene (1989), zusammenfassend: 

Westermann (1987c, Abschn. 2.4) 

nach Balzer, Moulines & Sneed (1987, S. 210-215) 



455 
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0 Es gibt Gemeinschaften der Wissenschaftler, die sich mit der Kognitionspsychologie, der 
Gedachtnispsychologie, der Gedachtnisentwicklung oder der Entwicklung des Arbeits- 
gedachtnisses beschaftigen. 

Die Grenzen einer konkreten wissenschaftlichen Gemeinschaft sind immer flieBend 
und unscharf, denn bei etlichen Personen hangt die Zugehorigkeit deutlich von der 
Wahl der Kriterien oder des Zeitpunktes ab. Es gibt jedoch fur jede interessierende 
wissenschaftliche Gemeinschaft einige Personen, die mit groBer Sicherheit zu ihr 
gehoren. Deshalb konnen wir iiber wissenschaftliche Gemeinschaften sprechen, auch 
wenn ihre genaue Zusammensetzung unbestimmt bleiben muss. 

9.3.2 Paradigmen 

Das wesentliche Charakteristikum einer wissenschaftlichen Gemeinschaft ist ihr 
Paradigma. Es stellt eine fachliche Prageform dar ( disciplinary matrix ) und umfasst 
die von alien Mitgliedern geteilten Festlegungen ( commitments ): 

• die allgemein akzeptierten Begrifflichkeiten, theoretischen Annahmen und 
empirischen Zusammenhange, 

• die der gemeinsamen Forschung zugrunde liegenden Weltanschauungen, Normen, 
Werte, Modelle, Analogien und Metaphern, 

• die allgemein akzeptierten Standards fur die Aufstellung, Uberprlifung und 
Modifikation von Hypothesen und Theorien sowie 

• die paradigmatischen Beispiele ( exemplars ). 

Die paradigmatischen Beispiele sind vorbildliche Problemlosungen, wie man sie 
beispielsweise in den Ubungsaufgaben von Lehrbuchern oder den Inhalten von 
Experimentalpraktika findet. In diesen Beispielen kommt alles zum Ausdruck, was 
zu einem Paradigma gehort: die von der wissenschaftlichen Gemeinschaft 
anerkannten Theorien, die als erfolgreich bewerteten Anwendungen dieser Theorien, 
Festlegungen von Hilfsmitteln, Apparaturen, Untersuchungsmethoden, Begriffs- 
bildungen und Operationalisierungen. 

In der Psychologie stellen der Behaviorismus und der Kognitivismus die 
deutlichsten Beispiele fur Paradigmen dar. 456 AuBerdem sind die Bewusstseins- 
psychologie in der Tradition von Wundt und die Gestaltpsychologie der Berliner 
Schule als Paradigmen im Sinne Kuhns beschrieben worden. 

0 Das Paradigma der Kognitionspsychologen ist unter anderem gekennzeichnet durch die 
Annahmen, dass das kognitive System Reprasentationen externer Objekte umfasst und 
dass menschliches Denken analog zur Informationsverarbeitung in Computern ablauft 457 
0 Nach dem Paradigma der Behavioristen wird das Verhalten ausschlieBlich durch 
Umweltreize gesteuert. 458 



Herrmann (1976), Groeben & Scheele (1977), Heinen (1980) 
Lachman, Lachman & Butterfield (1979) 





200 



Kapitel 9 



Ein Paradigma gibt der wissenschaftlichen Arbeit Richtung und Form. Es sagt dem 
Wissenschaftler, welche Arten von Objekten und Zusammenhangen er beschreiben 
und analysieren soil. 

Kein psychologisches Paradigma ist allerdings so unangefochten und dominierend 
wie die Paradigmen der ausgereiften Naturwissenschaften. 459 Die Psychologie ist 
vielmehr eine multiparadigmatische Wissenschaft, in der verschiedene wissenschaft- 
liche Gemeinschaften und Paradigmen nebeneinander existieren. 

Erworben wird die einheitliche Sichtweise eines Paradigmas wahrend der wissen- 
schaftlichen Ausbildung: durch die Inhalte der Lehrveranstaltungen, durch die 
Bewertungen von Diplom-, Promotions- und Habilitationsarbeiten sowie durch die 
Begutachtung von Manuskripten fiir Zeitschriften und Antragen fur Forschungs- 
projekte. Wahrend dieser langen Sozialisation neuer oder klinftiger Mitglieder 
werden diese immer wieder mit typischen Problemen und paradigmatischen 
Losungen konfrontiert. Sie erwerben damit ein oft implizites, intuitives Wissen fiber 
Theorien, Methoden und Normen, das dazu flihrt, dass sie Situationen in ahnlicher 
Weise „sehen“ und Probleme in ahnlicher Weise angehen wie die anderen Mitglieder 
der wissenschaftlichen Gemeinschaft. 

Die Bestandteile eines Paradigmas sind in der Regel nirgendwo vollstandig 

• • 

niedergeschrieben. Uber sie wird kaum offen diskutiert. Oft sind paradigmatische 
Annahmen den Wissenschaftlern iiberhaupt nicht bewusst und miissen erst 
rekonstruiert werden. Trotzdem verhalten sich die Mitglieder einer wissenschaft- 
lichen Gemeinschaft so, als hatten sie beschlossen, das Paradigma als Basis ihres 
wissenschaftlichen Denkens und Handelns zu akzeptieren und nicht in Frage zu 
stellen. 

Wissenschaftliche Theorien, Modelle und Hypothesen, die Bestandteile eines 
Paradigmas sind, werden also durch einen impliziten Beschluss der Mitglieder einer 
wissenschaftlichen Gemeinschaft akzeptiert. Im Gegensatz zu den Vorstellungen von 
Carnap und Popper spielen empirische Beobachtungen und Prlifungen dabei nur eine 
sehr untergeordnete Rolle. Etliche paradigmatische Annahmen sind auch so 
allgemein, dass sie gar keiner empirischen Prlifung oder Fundierung zuganglich 
sind. 460 Trotzdem sind derartige Beschliisse weder willkiirlich und unbegriindet, 
denn insgesamt wird ein Paradigma nur so lange akzeptiert, wie es zu erfolgreicher 
wissenschaftlicher Forschung fiihrt. 

9.3.3 Harte Kerne von Forschungsprogrammen 

Auch in der Methodologie der Forschungsprogramme von Imre Fakatos wird hervor- 
gehoben, dass wissenschaftliche Theorien zumindest teilweise per Beschluss der 

458 Bower & Hilgard (1983) 

459 Peterson (1981), Staats (1981), Westmeyer (1981), Gholson & Barker (1985), Witte 
(1987) 

460 Dazu gehoren auch Kants synthetische Urteile a priori (Kukla, 1989). 
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Wissenschaftler akzeptiert werden . 461 Die von einem Paradigma im Sinne Kuhns 
geleitete Forschung einer wissenschaftlichen Gemeinschaft bezeichnet Lakatos als 
ein Forschungsprogramm. Jedes Forschungsprogramm ist durch eine Reihe von 
aufeinander folgenden Theorien T ( , T 2 , T 3 , ... mit einem gemeinsamen harten Kern 
gekennzeichnet. Dieser Kern besteht aus einer Klasse von theoretischen Aussagen, 
fur die die Forscher beschlossen haben, sie trotz aller eventuell gegen sie 
sprechenden empirischen Befunde so lange wie mogliche beizubehalten. Die 
theoretischen Aussagen im harten Kern werden also per Beschluss als unwiderlegbar 
akzeptiert, sie sind vom Risiko einer Falsifikation ausgenommen. Theorieteile 
auBerhalb des harten Kerns konnen verandert werden: zum einen um abweichende 
empirische Befunde zu erklaren, zum anderen um die Theorie auf neue Sachgebiete 
anwenden zu konnen. 

0 In der psychologischen Forschung zur Dissonanztheorie werden die Grundannahmen der 
Theorie nicht in Frage gestellt: Kognitionen konnen konsonant und dissonant sein; die 
GroBe der Dissonanz hangt von den Wichtigkeiten der Kognitionen ab; Dissonanz 
erzeugt einen Reduktionsdmck; dieser Dmck ist umso groBer, je groBer die Dissonanz ist. 
Die verschiedenen Modifikationen und Weiterentwicklungen der Theorie stellen eine 
Theorienreihe dar. 

In der Psychologie gibt es neben derartigen theorie-orientierten Forschungs- 
programmen vor allem problem-orientierte Forschungsprogramme. In ihnen wird ein 
(relativ konstanter) Gegenstandsbereich sukzessiv mit Hilfe von verschiedenen 

AfS) 

Theorien, Hypothesen oder Modellen analysiert. 

0 Wie Meinungen und Einstellungen von Personen geandert werden konnen, wird in der 
Psychologie seit mehreren Jahrzehnten erforscht. Dabei wurden verschiedene Theorien 
zugrunde gelegt und verschiedene Aspekte betont, beispielsweise Eigenschaftstheorien, 
Konditionierungstheorien, soziale Urteilstheorien, Konsistenztheorien und rationale 
Handlungstheorien. 463 

In beiden Arten von Forschungsprogrammen spielen Theorien (im weitesten Sinn) 
eine unterschiedliche Rolle. In einem theorie-orientierten Forschungsprogramm wird 
eine (relativ konstante) Theorie unter verschiedenen Bedingungen geprtift, auf 
verschiedene Sachverhalte angewendet und im Idealfall immer weiter verbessert. In 
einem problem-orientierten Forschungsprogramm wird gepriift, inwieweit ein 
(relativ konstantes) Sachgebiet mit Hilfe unterschiedlicher Theorien analysiert und 
idealerweise immer besser erklart werden kann. 



461 Lakatos (1974b, 1982), zusammenfassend: Westermann (1987c, Abschn. 2.5) 

462 

Herrmann (1976, 1994). Die meisten Forschungsaktivitaten sind Teil mehrerer 
Forschungsprogramme und sowohl theorie- wie problem-orientiert. 

463 Saks & Krupat (1988), Stroebe & Jonas (1996) 





10 Entstehung und Veranderung von Theorien 



Wie wissenschaftliche Theorien entstehen, wird in Arbeiten zur Wissenschafts- 

geschichte beschrieben, teilweise auch bei der Darstellung von Theorien in 

Monographien oder Lehrbiichern. In der Wissenschaftstheorie wird versucht, die 

Entstehung oder Genese von Theorien systematisch zu analysieren. 

Weitgehend Einigkeit besteht darliber, dass die Entwicklung einer Theorie tiber 

die Zeit entscheidend von den vorhandenen Erfahrungen abhangt. Dabei werden je 

nach erkenntnistheoretischer Grundorientierung unterschiedliche Einflussfaktoren 

hervorgehoben. Empiristen betonen die „induktive“ Ableitung von neuen und 

modifizierten Theorien aus den jeweils gesammelten Erfahrungen (Kapitel 10.1). 

Rationalisten betonen die „deduktive“ Ableitung von Vorhersagen aus der jeweiligen 

Theorieform, deren Nicht-Eintreten Anlass fur weitere Modifikationen ist (Kapitel 

10.2). Schematisch ist dies in Abbildung 10.1 dargestellt. Bei der Entstehung einer 

psychologischen Theorie, lassen sich in der Regel alle Aspekte auffinden, je nach 

betrachteter Theorie aber unterschiedlich deutlich. Eine wichtige Rolle spielen auch, 

• • 

wie pragmatische Wissenschaftstheoretiker betonen, (stillschweigende) Uberein- 
kiinfte (Kapitel 10.3). 



Empirismus 


Rationalismus 


Theorie T 2 T 3 

A/V 

Erfahrung E, E 2 E 3 


Ti T 2 T 3 

\AA 

E| E 2 E 



Abbildung 10.1 : Induktive und deduktive Aspekte bei der Entstehung von Theorien 



10.1 Verallgemeinerungen von Erfahrungen 

Fur Empiristen entstehen Theorien durch Abstraktion und Verallgemeinerung von 
Erfahrungen, die Ableitung von Theorien ist fur sie also ein induktiver Prozess. 
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0 Die Theorie der kognitiven Dissonanz ist Anfang der fiinfziger Jahre aus Bemiihungen 
entstanden, die vorliegenden Forschungsergebnisse zur Beeinflussung von Meinungen 
durch soziale Kommunikation zu integrieren. 464 

Entwicklungsstufen 

Konkret wird bei der Beschreibung der Theoriengenese aus empiristischer Sicht 

haufig zwischen vier Stufen unterschieden: 465 

1. Die Objekte und Phanomene des Forschungsbereiches werden abgegrenzt, 
beobachtet und beschrieben. Dazu werden auch neue Begriffe eingefuhrt. 

0 Bereits in den vierziger Jahren wurden umfangreiche Erfahrungen liber die Aus- 
wirkungen von meinungsandernden Kommunikationen ( persuasive communications) 
gesammelt. Diese reichen von Erziehungsprogrammen und Werbefeldziigen bis hin 
zur Ausbreitung von Gertichten und Moden. In zahlreichen Berichten und praxis- 
orientierten Untersuchungen werden Durchfiihrung und Auswirkungen entsprechender 
Meinungsanderungen geschildert und interpretiert. Dazu wurden unter anderem 
Umfragen durchgefiihrt und interessierende Variablen miteinander korreliert. 
Beispielsweise wurde festgestellt, dass sich in einem von Erdbeben erschiitterten 
Gebiet in starkem MaBe Gerlichte verbreiteten, dass noch groBere Katastrophen ein- 
treten werden 467 

2. Um nicht nur Beobachtungen sammeln und beschreiben zu miissen, werden 
empirische Generalisierungen aufgestellt: einfache, meist nominale Gesetzes- 
annahmen, die die beobachteten RegelmaBigkeiten aufgreifen und verall- 
gemeinern. 

0 Festinger begann seine integrative Arbeit mit einer Zusammenstellung der 
empirischen Ergebnisse zur Ausbreitung von Gertichten. Als RegelmaBigkeit ergab 
sich dabei unter anderem: Damit ein Geriicht weite Verbreitung finden kann, muss 
eine groBe Anzahl von Personen sich in einer ahnlichen, unsicheren Lage befinden 
und in direktem oder indirektem Kontakt miteinander stehen 468 

In einem an der Yale-Universitat durchgefuhrten Forschungsprogramm wurden 
ebenfalls allgemeine Aussagen liber die Wirkung von Kommunikations- und 
Beeinfiussungsprozessen aufgestellt und experimentell geprlift. Dabei ergab sich unter 
anderem, dass eine Meinungsanderung durch Vertreten der neuen Meinung im 
Rollenspiel gefordert und durch Erzeugung von Angst behindert wird 469 

3. Die empirischen Generalisierungen werden in eine deduktive Systematisierung 
gebracht, so dass speziellere aus allgemeineren Satzen abgeleitet werden konnen. 



464 

465 

466 

467 

468 

469 



Festinger (1978, S. 8-11). Auch die Theorien von Charles Darwin und Jean Piaget 
entstanden nach umfangreichen Beobachtungen (Lewin, 1986, S. 37-38). 

Hempel (1958, S. 158), Kutschera (1972b, S. 252-253), Stegmuller (1974, S. 465-468) 
Hovland, Janis & Kelley (1953, S. V) 

Festinger (1978, S. 229-237) 

Festinger (1978, S. 9, 195) 

Hovland, Janis & Kelley (1953, S. 2-6, 271, 278) 
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0 Befunde zur Ausbreitung von Geriichten und zur Meinungsanderung nach Rollen- 
spielen werden durch die Annahme zusammengefasst, dass wir dazu tendieren, 
bevorzugt Informationen aufzunehmen, die mit unserem Verhalten ubereinstimmen. 

4. Das Stadium der Theorienbildung ist erreicht, wenn zur Erklarung der 
systematisierten Zusammenhange Begriffe, Konstrukte und Annahmen verwendet 
werden, die nicht mehr vollstandig durch beobachtbare Objekte und Beziehungen 
definiert werden konnen, sondern nur noch eine partielle Deutung erhalten. 

0 Mit dem theoretischen Begriff der Dissonanz und der Annahme, dass sie einen 
Reduktionsdruck nach sich zieht, kann Festinger viele Befunde zu Geriichten, Rollen- 
spielen und anderen Kommunikations- und Beeinflussungsprozessen in einheitlicher 
Weise theoretisch erklaren. AuBerdem konnen bislang nicht beachtete Phanomene aus 
der Theorie vorhergesagt und experimentell demonstriert werden, z.B. die veranderten 
Bewertungen gewahlter und nicht-gewahlter Alternativen nach getroffenen 
Entscheidungen oder die bevorzugte Aufnahme einstellungskongruenter Informa- 
tionen. 

Beschrdnkungen des Stufenschemas 

Das Stufenschema gibt nur eine vereinfachte, unvollstandige Darstellung der 

Theoriengenese. 470 Erstens sind in tatsachlichen Wissenschaftsprozessen die Stufen 

schwer abzugrenzen und konnen auch in veranderter Reihenfolge auftreten. 

Zweitens miissen Beobachtung und Theorienbildung nicht so weit entfernt sein, 

wie es den Anschein hat. Sie sind vielmehr eng miteinander verkntipft. Zum einen 

sind ohne Theorie gar keine systematischen Beobachtungen moglich, denn „die 

Natur antwortet nicht, wenn sie nicht gefragt wird“. 471 AuBerdem gibt es keine 

voraussetzungslose Beobachtung, so dass die Wissenschaft nicht einfach von den 

Beobachtungen zur Theorie voranschreiten kann (siehe oben Kapitel 9.1.3). 

Drittens werden wichtige Aspekte des wissenschaftlichen Fortschritts iiberhaupt 

nicht erwahnt, zum Beispiel Prazisierungen, empirische Bestatigungen oder 

Erschiitterungen von Hypothesen oder Ersetzungen von Theorien durch bessere. 

Viertens schlieBlich suggeriert dieses Stufenschema, dass die Theorien eindeutig 

und zwanglos aus Daten und empirischen Generalisierungen herauswachsen. Dies ist 

jedoch nicht der Fall. Die Einfiihrung theoretischer Begriffe und Erklarungs- 

prinzipien ist keine einfache Generalisierung, sondern ein ProblemlosungsprozeB 

eigener Art, der zu verschiedenen Ergebnissen ftihren kann. Welche Konzepte und 

Annahmen ein Wissenschaftler zur theoretischen Erklarung empirischer Befunde 

heranzieht, hangt zum einen von den bisher vertretenen Theorien ab, zum anderen 

von den grundlegenden Orientierungen seiner wissenschaftlichen Gemeinschaft. 

Diese Faktoren werden im Rahmen der rationalistischen und pragmatischen 
• • 

Uberlegungen zur Theoriengenese akzentuiert. 



Stegmiiller (1974, S. 471), Kutschera (1972b, S. 253) 
Popper (1994, S. 225) 
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0 Festingers Konzept der kognitiven Dissonanz und seine Annahme, dass Personen bestrebt 
sind, bestehende Dissonanz zu reduzieren, folgen nicht zwangslaufig aus den Befunden 
und Generalisierungen zu sozialen Beeinflussungsprozessen. Seine Theorie ergibt sich 
vielmehr aus den Grundannahmen einer Gruppe von Erklarungsansatzen, die man als 
Konsistenztheorien zusammenfasst: Kognitive Gegebenheiten streben nach Konsistenz, 
nach Ausgewogenheit, nach „guter Gestalt". Diese Grundannahme geht auf die 
Berliner Schule der Gestaltpsychologie zuriick. Aus ihr stammen Kurt Lewin, in dessen 
Theorie der Spannungsausgleich das oberste Leitprinzip ist, und Fritz Heider, dessen 
Balancetheorie noch heute bekannt ist. Festinger war Schuler von Lewin und erwahnt die 
Parallelitat seiner Theorie zu den Ideen Heiders. 473 



10.2 Prtifungen und Verbesserungen 

Fur Rationalisten entstehen Theorien primar durch Nachdenken, durch gezielten 
Einsatz des menschlichen Verstandes. Im Prinzip konnen sie durch zunachst vollig 
unbegrtindete Einfalle, Spekulationen und Antizipationen entstehen. 474 Eine Theorie 
wird allerdings, und dies ist entscheidend, nur dann beibehalten, wenn sie sich in 
nachfolgenden strengen empirischen Prtifungen bewahrt (Kapitel 10.2.1). Vollig neu 
sind Theorien nur selten. In der Regel besteht Theorienentwicklung darin, eine 
vorliegende Theorie zu falsifizieren und durch eine etwas andere, aber bessere 
Theorie zu ersetzen (Kapitel 10.2.2). 

10.2.1 Strenge und Bewahrung 

Eine Theorie wird empirisch gepriift, indem Vorhersagen iiber beobachtbare 
Sachverhalte abgeleitet und mit tatsachlichen Untersuchungsergebnissen verglichen 
werden. Eine empirische Prtifung einer Theorie soil uns, allgemein gesagt, 
Informationen dartiber geben, wie gut die Theorie ist, das heiBt wie gut sie die 
Realitat beschreiben, vorhersagen und erklaren kann. 

Besteht eine Theorie eine empirische Prtifung, d.h. stimmen die aus ihr 
abgeleiteten Vorhersagen hinreichend genau mit den Ergebnissen iiberein, spricht 
dies nur dann fur die Giite der Theorie, wenn die Prtifung ausreichend streng war. 
Auch im Alltag sagt eine bestandene Prtifung oder ein erworbenes Zertifikat nur 
dann etwas iiber die Qualifikation der Person aus, wenn die Prtifung hinreichend 
streng war. 

0 Eine Psychologin fiihrt in einem Betrieb eine Eignungspriifung fur eine besonders 
anspruchsvolle Tatigkeit durch. Setzt sie die Anforderungen zu niedrig, besteht die 
Gefahr, dass auch Personen die Prtifung bestehen, die tatsachlich gar nicht geeignet sind. 



Heckhausen (1989, S. 37-38) 
Festinger (1978, S. 21) 
Popper (1994, S. 7-8) 
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Deshalb fiihrt sie eine strenge Priifung durch: Ein Bewerber muss sehr hohe und genau 
festgelegte Kriterien erfullen, um fiir die Tatigkeit empfohlen zu werden. 

Strenge Priifungen von Theorien miissen demnach ein wichtiges Ziel jeder 
empirischen wissenschaftlichen Forschung sein. Dieses Ziel beinhaltet zwei Aspekte, 
die nicht vermengt werden diirfen: die Frage, inwieweit die Theorie prinzipiell streng 
prufbar ist, und die Frage, inwieweit sie tatsachlich streng gepriift wird: 

• Jede Theorie ist so zu formulieren, dass sie empirisch moglichst streng prufbar ist. 

• Jede empirische Priifung einer Theorie ist moglichst streng zu gestalten. 

Strenge Prufbarkeit und empirischer Gehalt 

Die Prufbarkeit einer Theorie ist umso groBer, je groBer ihr empirischer Gehalt ist: 

• Der empirische Gehalt ist umso groBer, je mehr potenzielle Falsifikatoren die 
Theorie hat, das heiBt je groBer die Menge der moglichen Beobachtungsaussagen 
ist, die der Theorie widersprechen. 475 

Der empirische Gehalt einer Theorie und damit die Strenge, mit der sie prufbar ist, 
kann erhoht werden, indem ihre Allgemeinheit und ihre Bestimmtheit vergroBert 
wird. Die Allgemeinheit einer Theorie wird erhoht, wenn die Menge der Objekte, 
Situationen oder Phanomene erhoht wird, auf die die Theorie anwendbar ist. Die 
Bestimmtheit einer Theorie wird erhoht, indem ihre Aussagen prazisiert werden. 

0 Die Dissonanztheorie diente urspriinglich zur Erklarung sozialer Beeinflussungsprozesse. 
Festinger erhohte ihre Allgemeinheit, indem er sie auch auf Situationen nach 
Entscheidungen und aufgenotigtem einstellungskontrarem Verhalten anwendete. 

0 Die Bestimmtheit der Dissonanztheorie wird erhoht, wenn nicht nur irgendeine Art der 

Dissonanzreduktion vorhergesagt wird, sondern speziell angenommen wird, dass die 

476 

tatsachliche Meinung geandert wird. 

Ist ein theoretischer Zusammenhang als Implikation A — > B formuliert, ist die 
Allgemeinheit umso groBer, je haufiger die Pramisse A erfullt ist, und die 
Bestimmtheit ist umso groBer, je unwahrscheinlicher es ist, dass die Konklusion B 
erfullt ist. 

Der Gehalt einer Theorie darf aber nicht unbeschrankt erhoht werden. Je groBer 
der Gehalt ist, desto eher werden Daten der Theorie widersprechen. 477 Allgemeinheit 
und Bestimmtheit miissen deshalb so gewahlt werden, dass die Theorie in 
empirischen Priifungen auch noch eine faire Bewahrungschance hat. 



J Popper (1994, S. 77-87) 

476 siehe ausfiihrlicher unten Kapitel 1 1.4.3 

477 siehe Opp (1976, S. 264-277) 
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Strenge der Priifung und Grad der Bewahrung 

Von der Strenge, mit der eine Theorie (aufgrund ihrer Formulierung) priifbar ist, ist 
die Strenge zu unterscheiden, mit der sie in einer bestimmten Untersuchung 
tatsachlich gepriift wird. 478 

• Eine empirische Priifung ist streng, wenn sie so angelegt ist, dass ein Scheitem 
der zu priifenden Theorie zu erwarten ist, falls diese tatsachlich falsch ist. 479 

Anders ausgedrlickt: Die Priifung einer Theorie oder Flypothese ist um so strenger, je 
unwahrscheinlicher die aus der Theorie abgeleitete Vorhersage nach dem bisherigen 
Wissen (ohne die geprtifte Theorie) ist. Umgekehrt ist eine Priifung umso weniger 
streng, je wahrscheinlicher es aufgrund anderer Theorien und Annahmen ist, dass die 
Theorie sich bewahrt, auch wenn sie falsch ist. 

Konkret erhoht oder vermindert werden kann die Strenge einer Priifung durch die 
Art der Untersuchung, der Kontrolle von Storfaktoren, der statistischen Auswertung 
und der Entscheidungskriterien. Auf diese Aspekte der Versuchsplanung und der 
Sicherung der Validitat der Untersuchung gehen wir ausfiihrlich in den Kapiteln 12 
bis 18 ein. 

Wenn eine Theorie mehrfach empirisch gepriift wird und sich dabei jedes Mai 
bewahrt, ist der Grad der Bewahrung dieser Theorie umso groBer, je groBer die 
Anzahl der bestandenen Priifungen ist. Viel starker als von der Anzahl hangt der 
Bewahrungsgrad aber von der Strenge der Priifungen ab: 

• Je strenger die Priifungen waren, die eine Theorie erfolgreich bestanden hat, desto 
groBer ist der Grad der Bewahrung, den diese Theorie hat. 480 



10.2.2 Falsifikation und Erkenntnisfortschritt 

Wenn sich bei gezielten empirischen Priifungen systematische Abweichungen 
zwischen Theorie und Empirie zeigen, kann eine Theorie falsifiziert werden, sie 
muss aber nicht falsifiziert werden. Eine Theorie zu falsifizieren ist dann sinnvoll 
und notwendig, wenn sie durch eine bessere Theorie ersetzt werden kann. 

Eine neue Theorie T 2 ist besser als die urspriingliche Theorie T h wenn mit ihr ein 
Erkenntnisgewinn verbunden ist, d.h. wenn sie naher an der Wahrheit liegt. Dies ist 
dann der Fall, wenn die folgenden vier Bedingungen erflillt sind: 481 

478 Eine Theorie, die streng priifbar ist, kann je nach Gestaltung der Untersuchung tatsach- 
lich mehr oder weniger streng gepriift werden. Eine Theorie, die nicht streng priifbar ist, 
kann tatsachlich auch nicht streng gepriift werden. 

479 Popper (1965, S. 220-240), Gadenne (1976, S. 56) 

480 Diese Bewahrungsgrade nach Popper (1985, S. 217-278; 1994, S. 211-214) sollen, 
anders als Carnaps BestatigungsmaBe, keine Wahrscheinlichkeiten fur die Gtiltigkeit 
von Theorien sein (Gadenne, 1994a; Lenzen, 1974). Im pragmatischen Konzept der 
Bestatigung (siehe oben Seite 98) ist die Strenge der Priifung als Teil der Validitat 
berlicksichtigt (vgl. unten Kapitel 13). 
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1. T 2 steht mit alien Fakten in Einklang, mit denen auch T! in Einklang steht, 

2. T 2 steht mit wenigstens einigen Basissatzen in Einklang, die T! widersprechen, 

3. T 2 erlaubt dartiber hinaus die Ableitung neuer oder praziserer Vorhersagen, 

4. T 2 bewahrt sich in zumindest einigen dieser Priifungen. 

Die Ersetzung einer Theorie durch eine bessere, wahrheitsnahere kann als Teil eines 
evolutionaren Prozesses betrachtet werden, durch den die Anpassung der 
Organismen an die Umwelt sukzessiv verbessert wird. 482 

Empirischer Gehalt und Erkenntnisgewinn 

Wenn die vier genannten Bedingungen erfullt sind, hat die Theorie T 2 einen groBeren 
empirischen Gehalt und ist empirisch besser bewahrt als die Theorie T i . 

Die erste Bedingung ist meist nur dann zu erfullen, wenn die T 2 keine vollig neue 
Theorie ist. Bestiinde T 2 aus anderen Begriffen und Annahmen als T ( , ware meist 
nicht eindeutig festzustellen, ob sie auch mit den gleichen vorliegenden Ergebnissen 
vereinbar ist. T 2 wird deshalb haufig eine verbesserte Version von T | darstellen. 

In diesem Fall scheint es relativ einfach zu sein, auch die zweite Bedingung zu 
erfullen, denn fur jede Theorie lassen sich ad hoc spezifische Erganzungen finden, 
die genau die abweichenden Ergebnisse erklaren. 483 

Bei derartigen ad hoc Modifikationen kann jedoch meist die entscheidende dritte 
Bedingung nicht erfullt werden: Neue Vorhersagen ergeben sich nur, wenn die 
Theoriemodifikationen hinreichend allgemein sind, und nur wenn die neue Theorie 
auch neue, iiberprufbare Vorhersagen erlaubt, stellt sie tatsachlich einen Erkenntnis- 
gewinn dar. 



Progressive Theorienreihen 

Wenn die modifizierte Theorie T 2 sich bei einer empirischen Prtifung nicht bewahrt, 
muss auch sie wiederum modifiziert werden. Dadurch entsteht eine Theorienreihe 
T|, T 2 , T 3 usw. Diese Theorienreihe und damit auch das entsprechende Forschungs- 
programm ist solange progressiv, wie die jeweils neueste Theorie besser (im oben 
definierten Sinn) als ihre Vorgangerin ist. 484 

0 In etlichen Experimenten zur Uberpriifung der Dissonanztheorie traten die aus der 
Theorie vorhergesagten dissonanzreduzierenden Kognitions- oder Verhaltensanderungen 
nicht auf (siehe oben Seite 109). Um diese abweichenden Befunde erklaren zu konnen, 

485 

wurde Festingers Form der Dissonanztheorie von verschiedenen Autoren modifiziert. 



481 

482 

483 



484 

485 



Popper (1965, S. 232-242; 1994, S. 217, 429) 

Campbell (1974), Markl (1987), Radnitzky (1988), Popper (1984) 

Man kann stets annehmen, dass die an sich theoriekonformen Zusammenhange durch 
spezifische Merkmale der beteiligten Personen oder der realisierten situationalen 
Umstande verfalscht worden sind ( Exhaustion der Theorie, siehe oben Seite 35). 

Lakatos (1974b, S. 115-117) 

Aronson (1968), Irle (1975), siehe unten Abschnitt 11.4.2 
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Da diese Theoriemodifikationen zunehmend besser geeignet sind, vorliegende empirische 
Befunde zu erklaren, sind sie Elemente einer progressiven Theorienreihe. 

0 Fur Attributionstheoretiker wird menschliches Verhalten und Erleben wesentlich durch 
Ursachenwahrnehmungen bestimmt. Als entscheidend wurde dabei zunachst angesehen, 
ob eine internale oder eine externale Ursachenzuschreibung vorgenommen wurde. Spater 
wurden die zugeschriebenen Ursachen zusatzlich danach klassifiziert, ob sie stabil oder 
variabel sind. Eine noch bessere Erklarung empirischer Befunde erhielt man, als man 
auBerdem zwischen kontrollierbaren und unkontrollierbaren Ursachen unterschied. 486 
0 Die ACT*-Theorie von J.R. Anderson war bei ihrer Presentation im Jahre 1983 das letzte 
Element einer (progressiven) Reihe von Theorien zur Erklarung menschlicher kognitiver 
Prozesse. Am Anfang stand ein Modell zur Computersimulation der inhaltlichen Kate- 
gorisierungen, in denen die freie Wiedergabe von Lernmaterial erfolgte. In nachfolgenden 
Theorieformen wurden sukzessiv verschiedene vorliegende theoretische Konzepte 
integriert: propositionale Netzwerkreprasentationen, Produktionssysteme und 

Mechanismen der Aktivationsausbreitung. Diese Veranderungen erfolgten, um immer 

488 

mehr Bereiche von kognitiven Phanomenen simulieren und erklaren zu konnen. 



10.3 Anpassungen und Umwalzungen 

Aus pragmatischer Sicht werden bei der Betrachtung der Genese einer Theorie die 
Faktoren betont, die mit ihrer Verwendung zu tun haben: mit den Personen, die sie 
vertreten, mit den Zwecken, denen die Theorie dienen soil, mit der wissenschaft- 
lichen Entwicklungsperiode, in der die Theorie entstand. Beschrieben und betont 
werden derartige pragmatische Faktoren insbesondere von Thomas Kuhn. 489 

Nach seinen Ergebnissen miissen wahrend der Entwicklung einer Wissenschaft 
normalwissenschaftliche und revolutionare Phasen unterschieden werden. Wahrend 
der langen normalwissenschaftlichen Phasen lauft die Theorienentwicklung vollig 
anders ab als in den relativ kurzen revolutionaren Phasen. 

Normalwissenschaftliche Forschung 

Jede normalwissenschaftliche Phase ist durch ein bestimmtes Paradigma gekenn- 
zeichnet, d.h. durch ein allgemein akzeptiertes fachliches Pragesystem und seine 
exemplarischen Problemlosungsbeispiele, die zu einer einheitlichen Art der Welt- 
sicht, der Problembearbeitung und Forschung flihren. Die normale, paradigmen- 
geleitete Forschung beruht auf der impliziten Annahme, dass die wissenschaftliche 
Gemeinschaft grundsatzlich weiB, wie die Welt beschaffen ist. 



" ou Weiner (1992, S. 248-253) 

487 Anderson (1983, S. vii - ix) 

488 

In nachfolgenden Jahren wurde auch die ACT* erheblich revidiert. Eine der spateren 
Versionen ist ACT-R (Anderson, 1993, 1996b; Anderson & Matessa, 1997). 

489 Kuhn (1974, 1977a, 1981), vgl. oben Seite 199 ff. 
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Der Nachteil normalwissenschaftlicher Forschung besteht darin, dass sie eher 
bestrebt ist, an bestimmten Begriffen, Gesetzen, Theorien und Methoden festzu- 
halten, als neue Theorien und Iiberraschende Fakten zu finden. Man kann sie „als 
einen rastlosen und hingebungsvollen Versuch beschreiben, die Natur in die von der 
Fachausbildung gelieferten Begriffsschubladen hineinzuzwangen“. 

Der Vorteil der normal wissenschaftlichen Forschung besteht darin, dass die 
Paradigmen die Fahigkeit des Wissenschaftlers verbessern, fachwissenschaftliche 
Probleme zu losen. Ein Paradigma zwingt die Wissenschaftler, ihre Gegenstands- 
bereiche mit einer Genauigkeit und bis zu einer Tiefe zu beschreiben und zu 
erklaren, die sonst niemals in Angriff genommen worden waren. 

0 Innerhalb des behavioristischen Paradigmas wurden viele Aspekte des Lernens bei Tieren 
und Menschen in zahlreichen Experimenten sehr detailliert analysiert, beispielsweise der 
Verlauf von Generalisationsgradienten, die Grenzen der Reizdiskrimination oder die 
Wirkung unterschiedlicher intermittierender Verstarkungen. 1 

Anomalien 

Besonders interessant sind in der normalwissenschaftlichen Forschung systematische 
Abweichungen zwischen theoretischen Erwartungen und empirischen Beobach- 
tungen. Sie werden von Kuhn als Anomalien bezeichnet. Nach Popper sollen der- 
artige Anomalien (unter bestimmten Bedingungen) zur Falsifikation der Theorie und 
zur Aufgabe des gesamten Paradigmas flihren. Kuhn zieht jedoch aus seinen 
historischen Untersuchungen den Schluss, dass Wissenschaftler noch niemals auf 
eine Anomalie mit einer sofortigen Falsifikation der ganzen Theorie reagiert haben. 

0 Obwohl in etlichen Experimenten vorhergesagte, dissonanzreduzierende Effekte nicht 
auftraten, wurde die Dissonanztheorie nicht aufgegeben, sondern mehrfach modifiziert. 

0 Nach der ursprtinglichen Lern- und Motivationstheorie von Clark Hull ist die Starke oder 
Wahrscheinlichkeit einer Reaktion auf einen Reiz von der allgemeinen Antriebsstarke 
und der Anzahl der bisherigen Verstarkungen abhangig („Reaktionspotential = 
Triebstarke mal Habitstarke“)- Nicht erklart werden kann mit dieser Theorie, dass Lernen 
auch ohne unmittelbare Verstarkung erfolgen kann (latentes Lernen) und dass die 
Verhaltensintensitat auch vom aktuellen AusmaB der Belohnung abhangt (Crespi-Effekt). 
Angesichts dieser abweichenden Befunde wurde Hulls Theorie nicht aufgegeben, sondern 
um eine Anreizkomponente erganzt. 2 

Zur Beschreibung und Erklarung der interessierenden Phanomene versuchen die 

normalwissenschaftlichen Forscher bestandig, ihre Theorien mit der Empirie in eine 
• • 

bessere Ubereinstimmung zu bringen. Die Theorien werden dabei als Werkzeuge 
betrachtet, mit denen die Empirie bearbeitet wird. Gelingt die theoretische 



Kuhn (1981, S. 19) 

Bredenkamp & Wippich (1977), Foppa (1965) 
Weiner (1988, S. 73-88) 
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Beschreibung und Erklarung der empirischen Phanomene nicht, diskreditiert dies 
zunachst einmal nicht die Theorie, sondern nur den Wissenschaftler: „Das ist ein 
schlechter Zimmermann, der seinem Werkzeug die Schuld gibt“. 493 

Lasst sich eine Anomalie nicht anders beseitigen, miissen die Begriffe und 
Annahmen der Theorie so verandert werden, dass auch diese Anomalie erklart 
werden kann. Erst wenn diese Anpassung erfolgreich abgeschlossen ist, stellt die 
Anomalie eine wirkliche Entdeckung in dem Sinne dar, dass man nicht nur 
bestimmte Beobachtungen hat, sondern diese auch in Begriffe fassen und durch 
Theorien einordnen kann. Diese Entdeckungen und theoretischen Modifikationen 
sind eine besonders wichtige Art des normalwissenschaftlichen Fortschritts. 

Auch wenn das Paradigma die Forscher wiederholt in schwierig aufzulosende 
Anomalien hineinfiihrt, so bleibt das eigentliche Paradigma wahrend der normal- 
wissenschaftlichen Phasen doch im wesentlichen unverandert, alle Theorie- 
modifikationen sind mit ihm vertraglich. 

0 Alle von Anderson in die verschiedenen Formen seiner ACT-Theorie einbezogenen 
Begriffe und Konzeptionen gehoren zum kognitionspsychologischen Paradigma, sie 
beruhen alle auf der Grundannahme, dass die menschliche Geistestatigkeit als infor- 
mationsverarbeitendes System betrachtet werden kann. 

Aufierordentliche Wissenschaft 

Wenn sich eine wichtige Anomalie hartnackig und iiber langere Zeit alien 
Auflosungsversuchen widersetzt, kann dies die Wissenschaft in eine Krise und eine 
Phase aufierordentlicher Wissenschaft flihren. Im Gegensatz zur normalen ist die 
auBerordentliche Forschung dadurch gekennzeichnet, dass verschiedene konkur- 
rierende, aber letztendlich nicht voll befriedigende Modifikationen der paradig- 
matischen Theorien auftauchen. AuBerdem werden zunehmend die bisher unhinter- 
fragt anerkannten Theorien, Methoden, Regeln und Normen zur Diskussion gestellt. 

0 In den fiinfziger, sechziger Jahren zeigte sich deutliche Unzufriedenheit mit dem 
behavioristischen Paradigma, weil es nicht geeignet schien, komplexere geistige Prozesse 
(Problemlosen, Textverstehen, Sprachentwicklung usw.) adaquat zu erklaren. 

Wissenschaftliche Revolutionen 

Eine Phase auBerordentlicher Wissenschaft kann dadurch beendet werden, dass die 

aufgetretenen Anomalien im Rahmen des bisherigen Paradigmas doch noch 

aufgelost werden konnen. Wenn dies nicht gelingt, kann die Krise in eine 

wissenschaftliche Revolution mtinden. Diese besteht darin, dass das alte Paradigma 

der wissenschaftlichen Gemeinschaft durch ein neues abgelost wird. 

• • 

Anders als Anderungen des Paradigmas innerhalb des normalwissenschaftlichen 
Forschungsprozesses ist die „revolutionare“ Ersetzung eines Paradigmas durch ein 



493 



Kuhn (1981, S. 93) 
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anderes nicht mehr Teil eines kumulativen Entwicklungsprozesses, sondern stellt 
einen volligen Neuaufbau des betreffenden Fachgebietes dar: Nach dieser Revolution 
haben die Wissenschaftler ihre Anschauungen, Methoden und Ziele vollstandig 
geandert, sie sehen die Welt ihres Fachgebietes „mit anderen Augen“, auch wenn sie 
die gleichen Phanomene betrachten, die sie vorher schon einmal untersucht haben. 

0 Im behavioristischen Paradigma wurde Lernen als passive, mechanische Kopplung 
zwischen Verhaltensweisen und Umweltereignissen betrachtet. Im kognitivistischen 
Paradigma beruht menschliches Lernen auf der aktiven Verarbeitung von Informationen 
und fiihrt zur Bildung von Erwartungen, Regeln, Wissenselementen, Planen usw. 



Im Vergleich zur normalwissenschaftlichen Entwicklung neuer oder modifizierter 

Theorien ist die revolutionare Theoriengenese viel weniger eingeschrankt und 

vorherbestimmt. Die Theorien vor und nach einer wissenschaftlichen Revolution 

sind inkommensurabel, das heiBt sie sind in ahnlichem Sinne unvergleichbar wie 

• • 

verschiedene Sprachen: Ubersetzungen sind jeweils nur bis auf eine bestimmte 
Annaherung moglich. Beispielsweise kann meist nicht eindeutig festgestellt werden, 
ob eine vor- und eine nachrevolutionare Theorie mit den gleichen empirischen 
Ergebnissen vertraglich sind. Auch kann meist nicht eindeutig bewiesen werden, 
dass die neue Theorie empirisch gehaltvoller oder besser bestatigt ist als die alte. 
Trotzdem konnen die neuen Theorien in bestimmter Hinsicht ein Fortschritt 
gegenliber den alten darstellen, beispielsweise weil sie umfassender sind, weil sie 
praziser sind oder weil sie Phanomene erklaren, die vorher gar nicht analysiert 
werden konnten. 



Da es keine allgemein akzeptierten Kriterien fur die Wahl zwischen 
verschiedenen Paradigmen gibt, spielen bei der Entstehung und Verbreitung eines 
neuen Paradigmas wissenschaftssoziologische und wissenschaftspsychologische 
Faktoren eine entscheidende Rolle. Statt logisch, theoretisch oder empirisch 
fundierten Argumentationen finden sich in diesen Umbruchphasen haufig (wie bei 



• • 

politischen Revolutionen) Uberredungsversuche, Polemiken, Propagandafeldztige 



usw. 



Bower & Hilgard (1983, 1984) 

495 Die Bezeichnung „wissenschaftliche Revolution 44 rechtfertigt Kuhn durch die Parallelitat 
mit politischen Revolutionen. Beide werden durch ein wachsendes Gefiihl eingeleitet, 
dass die bestehenden Institutionen den von ihnen selbst mitgeschaffenen Problemen 
nicht gerecht werden. Diese Institutionen sollen durch andere ersetzt werden, mit 
Mitteln, die von ihnen selbst verboten wurden. Dabei entsteht voriibergehend eine 
Periode ohne vorherrschende Institution. Dieser revolutionare Prozess ist durch Ausein- 
andersetzungen zwischen Anhangern des alten und des neuen Systems gekennzeichnet. 
Da die Kombattanten keinen Rahmen fur die Beilegung ihrer Meinungsverschieden- 
heiten anerkennen, mussen sie „letzten Endes zu den Methoden der Massentiberredung 
Zuflucht nehmen, die oft genug Gewalt einschlieBen 44 (Kuhn, 1981, S. 105 - 106). 
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Vor allem aber versuchen die Vertreter des neuen Paradigmas, die nachwachsende 
Generation auf ihre Sichtweise einzuschworen. Gelingt dies, kann man ruhig darauf 
warten, dass die Vertreter des alten Paradigmas sich allmahlich zuriickziehen. 496 

Selbst in einer revolutionaren Phase erfolgt die Theorienbildung jedoch nicht 
vollig frei, sondern wird durch vorhandene Paradigmen, Theorien, Techniken, 
geistige Stromungen, gesellschaftliche Bedingungen usf. beeinflusst. 

0 Das psychoanalytische Paradigma von Sigmund Freud entstand unter dem Einfluss medi- 
zinischer Studien und Behandlungen der Hysterie (Charcot und Breuer), biologischer 
Selektionsmechanismen (Darwin), physikalischer Energieerhaltungsprinzipien (von 
Helmholtz) und sozialer Verdrangungs- und Unterdruckungsgewohnheiten. 497 Die 
grundlegenden Mechanismen der Triebakkumulation und -abfuhr zeigen deutliche Ana- 
logien zu den damals modernen hydrodynamischen Techniken (Dampfmaschinen). 

0 Im kognitionspsychologischen Paradigma finden wir das gleiche Streben nach allgemei- 
nen Gesetzen und experimenteller Fundierung wie im behavioristischen Paradigma. 
Grundkonzepte (wie das Kurzzeitgedachtnis) und Techniken (wie das serielle Lernen) 
stammen aus der Psychologie des verbalen Lernens. 498 Denkprozesse werden als Infor- 
mationsverarbeitung erklart, zunachst mit verschiedenen Speichern und sequentieller 
Arbeitsweise, spater teilweise analog zu Computern, die parallel arbeiten. 

0 Nach der Signalentdeckungstheorie erfolgen Entscheidungen analog zur Prtifung 
statistischer Hypothesen mit Signifikanztests. Nach der Attributionstheorie von Kelly 
erfolgen Ursachenzuschreibungen analog zu varianzanalytischen Berechnungen 499 

Neue Paradigmen und Theorien, und seien sie auf den ersten Blick noch so originell, 
sind demnach kaum jemals vollstandig neu, sondern in der Regel in die aktuelle 
Wissenssituation eingebettet. Eine neue und adaquate Theorie zu entwickeln, 
erfordert nicht nur Wissen, sondern auch Kreativitat. Bei der Suche nach neuen 
theoretischen Ideen konnen verschiedene Strategien und Heuristiken der 
Problemlosung hilfreich sein: der Ruckgriff auf analoge Losungen in anderen 
Bereichen, die systematische Integration bisheriger Forschungsergebnisse, die 
Auswertung von explorativen Untersuchungen, die Nutzung von intro spektiven 
Erfahrungen, die Analyse der biologischen ZweckmaBigkeit u.a. 500 



496 



497 

498 

499 

500 



„Eine neue wissenschaftliche Wahrheit pflegt sich nicht in der Weise durchzusetzen, 
dass ihre Gegner tiberzeugt werden und sich als belehrt erklaren, sondern vielmehr 
dadurch, dass die Gegner allmahlich aussterben und dass die heranwachsende 
Generation von vornherein mit der Wahrheit vertraut gemacht ist“ (Max Planck, 1928, 
zitiert nach Kuhn, 1981, S. 162). 

Weiner (1988, S. 17-72) 

Lachman, Lachman & Butterfield (1979, S. 35-87) 

Gigerenzer (1988, 1991) 

Dorner (1994), McGuire (1997). 





11 Struktur wissenschaftlicher Theorien 



Im Kapitel 10 wurde die Genese von Theorien behandelt, d.h. wie Theorien 
aufgebaut werden. Die Wissenschaftstheorie hat sich jedoch starker mit der Struktur 
von Theorien beschaftigt, d.h. wie Theorien aufgebaut sind: Aus welchen Kompo- 
nenten bestehen Theorien? Wie sind diese miteinander verbunden? Wie sind Theo- 
rien und ihre Komponenten formuliert? Welche Aussagen lassen sich aus ihnen ab- 
leiten? 

Die Ergebnisse wissenschaftstheoretischer Analysen empirischer Theorien 
konnen als Metatheorien gekennzeichnet werden, d.h. als Theorien iiber 
(substanzwissenschaftliche) Theorien. Metatheorien konnen deskriptiv oder 
normativ verwendet werden, d.h. um zu beschreiben, wie substanzwissenschaftliche 
Theorien tatsachlich sind oder um festzulegen, wie sie sein sollten. 

Sehr einflussreich war die metatheoretische Konzeption, die vom logischen 
Empirismus entwickelt worden ist und die als Standardtheorienkonzeption 
bezeichnet wird. Sie wird im Kapitel 11.1 vorgestellt. Eine differenziertere und 
adaquatere Beschreibung substanzwissenschaftlicher Theorien erhalten wir durch die 
strukturalistische Wissenschaftstheorie. Dies wird ausfuhrlich in den Kapiteln 11.2 
bis 11.9 demonstriert. Dabei wird sich unter anderem zeigen, dass diese struktura- 
listische Metatheorie gut geeignet ist, die Verbindung verschiedener Theorien und 
die Veranderung einer Theorie iiber die Zeit nachzuzeichnen. 



11.1 Standardkonzeption: Theorien als deduktive Aussagensysteme 

Die letzte Version der vom logischen Empirismus entwickelten Standardkonzeption 
wissenschaftlicher Theorien kann in vier Punkten zusammengefasst werden: 501 



501 



Carnap (1986, S. 225-245), Feigl (1970), Hempel (1970), zusammenfassend: Groeben & 
Westmeyer (1975, S. 61-62), Suppe (1977) und Stegmiiller (1974, S. 197, 234-235) 
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1 . Axiomatisierte Aussagensysteme 

Eine wissenschaftliche Theorie ist ein axiomatisiertes deduktives Aussagen- 
system, das heiBt sie umfasst eine Menge von Aussagen, die logisch aus einer 

509 

Menge von Grundaussagen (Axiomen) ableitbar sind. 

2. Logische Formalisierung 

Die axiomatische Formulierung der Theorie erfolgt in einer einheitlichen 
formalen Sprache, vorzugsweise in der Pradikatenlogik. 

3. Zweisprachenkonzeption 

Es gibt eine theoretische Sprache L x und eine Beobachtungssprache L 0 . 

4. Zuordnungsregeln 

Zumindest einige Begriffe der theoretischen Sprache L x sind durch Zuordnungs- 
regeln mit Begriffen der Beobachtungssprache L 0 verbunden. 

Im folgenden Kapitel 11.1.1 werden die in den letzten beiden Punkten angesproche- 
nen Sprachen und Zuordnungen besprochen, im Kapitel 11.1.2 dann die geforderten 
Axiomatisierungen und Formalisierungen. 






Abbildung 11.1: Veranschaulichung der Zweisprachenkonzeption 



502 

Die hier geforderte deduktive Ableitung von theoretischen Aussagen aus den Axiomen 
ist zu unterscheiden von der logisch-empiristischen Vorstellung einer „induktiven 
Ableitung“ von Theorien aus Beobachtungen (siehe Kapitel 10.1). 
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11.1.1 Zweisprachenkonzeption und Zuordnungsregeln 

Die Zweisprachenkonzeption wurde von Carnap eingeflihrt, da sich seine 
urspriingliche Forderung nicht realisieren lieB, alle theoretischen Begriffe durch 
explizite operationale Definitionen eindeutig und vollstandig auf Beobachtbares 
zurlickzufuhren (siehe oben Kapitel 5.3). Die Beobachtungssprache L 0 enthalt nur 
Begriffe, die Beobachtbares bezeichnen oder durch explizite Definitionen auf 
Beobachtungsbegriffe zuriickgefiihrt werden konnen. Alle anderen Begriffe gehoren 
zur theoretischen Sprache L x . Zuordnungsregeln sind Satze, die mindestens einen 
Beobachtungsbegriff und mindestens einen theoretischen Begriff enthalten und 
Hinweise auf die moglichen empirischen Anwendungen der Theorie geben. 

In der Abbildung 11.1 wird die Zweisprachenkonzeption durch zwei ubereinander 
schwebende Netze veranschaulicht. Die Knoten des oberen, theoretischen Netzes 
reprasentieren die Variablen und Begriffe der Theorie. Die Faden zwischen diesen 
Knoten stellen die theoretischen Annahmen fiber die Zusammenhange zwischen 
diesen theoretischen Konzepten dar. Dementsprechend stellen die Knoten des 
unteren, empirischen Netzes beobachtbare Variablen und Beobachtungsbegriffe dar, 
wahrend die Faden zwischen diesen Knoten regelmaBige Beziehungen zwischen 
beobachtbaren GroBen reprasentieren. Die Zuordnungsregeln sind als vertikale 
Strange dargestellt, die einige Knoten des theoretischen Netzes mit einigen Knoten 
des empirischen Netzes verbinden. 

Psychologische Anwendungen 

Die Zweisprachenkonzeption liegt vielen bekannten psychologischen Konzeptionen 
zugrunde, die mit dem Problem der Operationalisierung verbunden sind. 

Die Operationalisierung ist einer der ersten und wichtigsten Schritte jedes 
psychologischen Forschungsprozesses: 503 Fur jeden wissenschaftlichen Begriff, der 
in der Fragestellung oder Flypothese auftritt, muss festgelegt werden, wie er 
praktisch und konkret hergestellt oder erfasst werden soil. 

0 GemaB einer Gesetzesannahme der Dissonanztheorie ist der verbleibende Meinungs- 
unterschied umso kleiner, je kleiner die Belohnung fur ein einstellungskontrares 
Verhalten ist. Um zu untersuchen, ob diese Annahme in einer bestimmten Situation giiltig 
ist, miissen mindestens eine groBere und eine kleinere Belohnung festgelegt werden und 
die tatsachlichen Meinungen der beteiligten Personen mtissen moglichst unverfalscht und 
genau erfasst werden (z.B. liber einen Fragebogen oder ein Interview). 

Eine bewahrte Vorgehensweise zur Begriindung von Operationalisierungen ist die 
Konstruktvalidierung. 504 Dabei wird theoretisch und empirisch untersucht, ob ein 
vorliegendes Test- oder Fragebogenverfahren tatsachlich geeignet ist, das 
interessierende Merkmal zu erfassen. Dazu wird zunachst theoretisch spezifiziert, 



Bortz & Doring (1995, S. 60), Kerlinger (1978, S. 74) 
Cronbach (1984, S. 121-157), Fisseni (1990, S. 86-91) 
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mit welchen anderen theoretischen Variablen das interessierende Merkmal positiv 
oder negativ verbunden ist und mit welchen theoretischen GroBen es nichts zu tun 
haben sollte. Dann wird empirisch geprlift, ob diese Erwartungen zutreffend sind. 

0 Die Intelligenz von Personen sollte u.a. positiv mit der Giite ihrer Schulabschliisse 
zusammenhangen, negativ mit Zeit, die sie fur das Losen von Problemen benotigen, aber 
moglichst gar nicht mit ihrem Neurotizismusgrad. Fur die Konstruktvaliditat eines 
Intelligenztests spricht es deshalb, wenn sich diese theoretisch erwarteten Beziehungen in 
den Korrelationen des Tests mit den entsprechenden empirischen Werten fur Schul- 
bildung, Bearbeitungszeiten und Neurotizismus wiederfinden. 

Die Zweisprachenkonzeption liegt auch den kausalanalytischen Verfahren wie 
LISREL zugrunde. Sie priifen substanzwissenschaftliche Elypothesen liber kausale 
Zusammenhange zwischen mehreren GroBen anhand von nicht-experimentellen, 
korrelativen Daten. 505 Dabei wird explizit unterschieden zwischen den theoretischen 
oder latenten Variablen, auf die sich die Kausalhypothesen beziehen, und ihre 
beobachtbaren Indikatoren, liber deren Korrelationen die empirische Priifung erfolgt. 

0 Um die Abhangigkeit des Berufserfolgs von Wirtschaftswissenschaftlern von ihrer 
Intelligenz, ihrer Ausbildungsqualitat und ihrer sozialen Herkunft zu untersuchen, wird 
jede dieser drei latenten Variablen durch mehrere Beobachtungs variablen operatio- 
nalisiert. Der Berufserfolg einer Person kann beispielsweise durch das Jahresgehalt und 
durch die Einschatzung der Vorgesetzten erfasst werden, die Intelligenz durch die 
verschiedenen Untertests des Intelligenz-Struktur-Tests usw. 

Probleme 

Die von der Zweisprachenkonzeption vorausgesetzte strikte Trennung zwischen 
einer theoretischen Sprache und einer Beobachtungssprache ist mit verschiedenen 
Problemen behaftet. 

Erstens gibt es keine klaren Kriterien daflir, was direkt beobachtbar ist. Vielmehr 
muss man von einem Kontinuum ausgehen, das von ganz direkten sinnlichen 
Erfahrungen bis hin zu relativ indirekten Beobachtungen unter Verwendung 
komplexer Apparaturen reicht. 

0 Direkt beobachten kann man, dass eine Person bei einem Intelligenztest die Frage nach 
der Hauptstadt von Belgien mit „Amsterdam“ beantwortet. Der Blutdruck und der Haut- 
widerstand bei der Beantwortung dieser Frage sind nur mit Hilfe physiologischer 
Messinstrumente und damit nur indirekt beobachtbar. Noch indirekter sind die 
„Beobachtungen“ neuronaler Ereignisse, die ein Elektroenzephalogramm (EEG) oder 
eine Positronen-Emissions-Tomograph (PET) liefert. 

Zweitens gibt es keine Beobachtungen, die frei von Voraussetzungen oder Theorien 
(in einem ganz allgemeinen Sinn) sind. In jede Beobachtung flieBen vorhandene 
Kenntnisse, Begrifflichkeiten, Erwartungen oder Gewohnheiten mit ein, auch wenn 



505 



Joreskog & Sorbom (1993), siehe oben FuBnote 393, Seite 163 
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es dem Beobachter nicht bewusst ist. Beobachtungen sind immer Interpretationen im 
Lichte von Theorien, sie sind immer von Theorien „durchtrankt“. 506 

Deshalb ist es sinnvoll, nicht mehr von einer Beobachtungssprache zu reden, 
sondern von vorher verfugbaren Be griff en. 507 Zu diesen gehoren auch Begriffe, die 
zwar nicht im engeren Sinne direkt beobachtbar sind, die aber bereits im 
Zusammenhang mit anderen Theorien eingefiihrt worden sind. 

0 Wenn wir in der Dissonanztheorie von einem einstellungskontraren Verhalten sprechen, 
setzen wir voraus, dass alien Anwendern der Theorie hinreichend klar ist, was unter der 
Einstellung einer Person zu verstehen ist und wie die direkt nicht beobachtbaren Einstel- 
lungen durch Fragebogen oder Interviews erfasst werden konnen. Im Zusammenhang mit 
der Dissonanztheorie ist „Einstellung“ also ein vorher verfiigbarer Begriff. 

Dies hat den Vorteil, dass theoretische und nicht-theoretische Begriffe nicht generell 
getrennt werden miissen, sondern speziell in Bezug auf eine Theorie die bereits 
bekannten Begriffe von den neuen, theoriespezifischen Begriffen abgegrenzt werden 
konnen. Weiterentwickelt wird dieser Gedanke im Kriterium fiir theoriespezifische 
Begriffe der strukturalistischen Wissenschaftstheorie (siehe Kapitel 11.7). 

11.1.2 Formalisierung und Axiomatisierung 

Die vom logischen Empirismus geforderte eindeutige Formalisierung von wissen- 
schaftlichen Theorien in einer kiinstlichen Sprache, die keine umgangssprachlichen 
Begriffe mehr enthalt, hat sich in keiner wissenschaftlichen Disziplin durchsetzen 
konnen. Gerade die Physik, die wie keine andere empirische Wissenschaft Gebrauch 
von mathematischen Formulierungen macht, ist nicht vollstandig formalisierbar. 

Sehr gebrauchlich und nutzlich sind in den Naturwissenschaften dagegen 
Kombinationen von formalen und umgangssprachlichen Ausdriicken. 508 Als 
besonders geeignet hat sich dabei die informell-mengentheoretische Schreibweise 
erwiesen, die von der strukturalistischen Wissenschaftstheorie zur Rekonstruktion 
wissenschaftlicher Theorien verwendet wird. Sie ist sowohl ausreichend exakt wie 
hinreichend flexibel (siehe Kapitel 11.3 und 11.4). 

GroBen Einfluss hat die Forderung der Logischen Empiristen nach der 
Axiomatisierung gehabt. Nicht nur die Theorien der Mathematik, sondern auch die 
Theorien der empirischen Wissenschaften sollten stets in axiomatisierter Form 
dargestellt werden. Dies bedeutet, dass alle Aussagen der Theorie aus einer 
bestimmten Untermenge von Aussagen ableitbar sein sollen. 

• Die grundlegenden Aussagen einer Theorie bezeichnet man als ihre Axiome. Die 
aus ihnen ableitbaren theoretischen Aussagen sind die Theoreme. 



vgl. oben Kapitel 9.1.3 
Hempel (1970, 1974) 

zu den Vorteilen: Opp (1976), Gadenne (1994b) 
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Prinzipiell darf kein Axiom aus den anderen Axiomen ableitbar sein (sonst ware es 
definitionsgemaB kein Axiom, sondern ein Theorem). Vor allem aber muss ein 
Axiomensystem widerspruchsfrei sein: Aus den Axiomen darf nicht zugleich eine 
Aussage A und ihre Negation — iA ableitbar sein. Aus praktischen Griinden sollte die 
Untermenge von Axiomen auBerdem moglichst klein sein. 

Durch eine Axiomatisierung werden die grundlegenden Annahmen der Theorie 
deutlicher herausgehoben, und die Menge der Aussagen, die tatsachlich in einer 
Theorie enthalten sind, kann klarer abgegrenzt werden. Dadurch wird es leichter, 
eine Theorie zu erlernen, sich mit ihr vertraut zu machen, sie zu uberpriifen und sie 
praktisch anzuwenden. Wegen ihrer unbestreitbaren Vorteile ist die Axiomatisierung 
von Theorien in der Wissenschaftstheorie als Idealvorstellung weitgehend akzep- 
tiert. 509 

Bei der tatsachlichen Darstellung psychologischer Theorien im Original oder in 
Lehrblichem sind die Texte jedoch oft so ungeordnet und ungenau abgefasst, dass es 
schwierig oder gar unmoglich ist, die Menge der von der Theorie getroffenen 
Aussagen oder die Untermenge der axiomatischen Grundaussagen zu identifizieren. 
In diesen Fallen bleibt unklar, ob bestimmte Aussagen mit der Theorie kompatibel 
sind, ob sie ihr widersprechen oder ob sie mit ihr gar nicht in Verbindung stehen. 
Dies vermindert betrachtlich den Wert, den die Theorie fur die Erklarung und 
Vorhersage von beobachtbaren Phanomen haben kann. 

Bei vielen psychologischen Theorien lassen sich die Axiome zumindest im 
Nachhinein relativ leicht bestimmen. Am besten ist das natiirlich bei einfachen 
Theorien moglich, die nur aus wenigen Aussagen bestehen. Aber auch umfangreiche 
theoretische Systemen lassen sich auf wenige Grundannahmen zuruckfuhren. 

0 Die Grundannahmen der Dissonanztheorie sind von Festinger in seinem Buch so deutlich 
beschrieben worden, dass sie als Axiome formuliert werden konnen. 510 
0 Die Balancetheorie von Fritz Heider ist zunachst graphentheoretisch, spater mengen- 
theoretisch formuliert und axiomatisiert worden. 511 
0 Fur die psychoanalytische Theorie von Freud hat Rapaport eine Menge von unabhan- 

512 

gigen Grundannahmen identifiziert. 



509 In der klassischen Axiomatisierung der Geometrie durch Euklid werden zunachst 
Grundbegriffe explizit definiert (z.B. „ein Punkt ist, was keine Teile hat 44 ) und dann 
Eigenschaften und Beziehungen formuliert (z.B. „durch zwei Punkte geht genau eine 
Gerade 44 ), die der Anschauung entnommen sind. Modernere Axiomatisierungen (wie der 
Geometrie von David Hilbert) lassen die Grundbegriffe undefiniert und wahlen die 
Axiome so, dass sich alle Aussagen der Theorie ableiten lassen (MittelstraB, 1995a, S. 
240; Regenbogen & Meyer, 1998, S. 90; Reinhardt & Soeder, 1978, S. 129). 

510 Krause (1972), Opp (1976, S. 347-352), Westermann (1987a, S. 14-19) 

511 Cartwright & Harray (1956), Sukale (1971) 

512 Rapaport (1959) 
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Etliche Theoriendarstellungen nahern sich dem Ideal einer axiomatischen 
Formulierung deutlich an: Zunachst werden explizit die Grundannahmen dargestellt, 
dann die sich daraus ergebenden Folgerungen. 

0 Anderson fasst seine ACT*-Theorie in 15 Punkten zusammen, die mit den entsprechend 

513 

formulierten Annahmen der Vorlauferversion verglichen werden konnen. 

0 Die Leistungsmotivationstheorie von Atkinson (das Risiko-Wahl-Modell ) umfasst sechs 
Grundannahmen. 514 Die wichtigsten Aussagen dieser Theorie lassen sich aus diesen 
Axiomen logisch ableiten. Zu diesen Theoremen gehort unter anderem die Aussage, dass 
bei Personen, die starker erfolgs- als misserfolgsmotiviert sind, die Annaherangstendenz 
gegenliber Leistungsaufgaben bei mittleren Schwierigkeiten am groBten ist. 

Einige bekannte Theorien der Psychologie sind mathematisch prazise und explizit in 
axiomatisierter Form formuliert. 

0 Die Lern- und Motivationstheorie von Clark Hull besteht in ihrer letzten Fassung aus 34 
Axiomen (17 sog. Postulate und 17 untergeordnete, aber nicht aus den Postulaten 
ableitbare Corollarien). Sie enthalten sowohl Aussagen liber die Beziehung zwischen 
theoretischen Begriffen als auch Aussagen liber Beziehungen zwischen theoretischen und 
empirischen Variablen (Zuordnungsregeln). Aus ihnen werden 133 Theoreme liber 
beobachtbare Sachverhalte deduziert. 515 

0 Bower und Trabasso haben eine Theorie entwickelt, die den Erwerb einfacher Konzepte 

durch sukzessive Hypothesenpriifung erklart. Sie wird als mathematisch- statistisches 

Modell mit sieben Grundannahmen formuliert. Aus diesen Axiomen lassen sich eindeutig 

Theoreme ableiten, beispielsweise liber die Form der Lernkurve, d.h. die Veranderung 

516 

der Wahrscheinlichkeit richtiger Antworten liber die Lerndurchgange. 

Auch die wissenschaftlichen Theorien, bei denen Grundannahmen identifiziert oder 
Axiome explizit formuliert sind, entsprechen allerdings nicht vollstandig der Ideal- 
vorstellung von Theorien als deduktiven Aussagesystemen. 

• Oft gibt es nicht die Moglichkeit, zweifelsfrei festzustellen, ob bestimmte 
Aussagen tatsachlich aus den Axiomen ableitbar sind . 517 

• In der Regel gibt es mehr als eine Moglichkeit, eine Menge von Aussagen als 
Axiome hervorzuheben und die restlichen als Theoreme zu betrachten, ohne dass 
eine dieser Moglichkeiten die eindeutig beste ist. 

• Etliche Aussagen, die wir tiblicherweise als wesentliche Konsequenzen der 
Theorie betrachten, folgen tatsachlich gar nicht logisch zwingend aus den 



513 

514 

515 

516 

517 



Anderson (1983, S. 22-23) 

Weiner (1988, S. 151-156), Gadenne (1994b, S. 298-299) 

Foppa (1965, S. 336-356) 

Bower & Trabasso (1964), Bredenkamp & Wippich (1977, S. 175-182), Deppe (1977, 
S. 103-125), vgl. oben Seite 148, die Lernkurve ist dort in (7-8) dargestellt. 

Nach dem bekannten Unvollstandigkeitssatz von Kurt Godel gibt es in vielen formalen 
Systemen Satze, bei denen nicht entscheidbar ist, ob sie aus den Axiomen folgen oder 
nicht (Regenbogen & Meyer, 1998, S. 712). 
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Axiomen allein. Sie konnen vielmehr nur mit Hilfe von zusatzlichen Annahmen 
und Informationen abgeleitet werden. 

0 Spezielle Gesetzesannahmen der Dissonanztheorie (z.B. „Nach einem einstellungs- 

kontraren Verhalten wird die Meinung umso starker geandert, je geringer die Beloh- 

nung ist“) ergeben sich aus den Grundannahmen der Theorie nur unter zusatzlichen 

Annahmen zur Entstehung von Dissonanz (z.B. „Je kleiner die Belohnung fur ein 

einstellungskontrares Verhalten ist, desto groBer ist die Dissonanz“). 

0 Aus den mathematischen Theorien der Lernpsychologie lassen sich prazise empirisch 

prufbare Aussagen (zum Beispiel iiber die genaue Wahrscheinlichkeit einer richtigen 

Antwort im zehnten Lerndurchgang) nur ableiten, wenn zuvor ein oder mehrere 

Modellparameter bestimmt worden sind. Diese spiegeln beispielsweise die anfangliche 

Wahrscheinlichkeit fur eine richtige Antwort oder die Schnelligkeit des Lernprozesses 

wider. Sie konnen auf Grund von allgemeinen Kenntnissen und bisherigen 

Erfahrungen gesetzt oder aus den betrachteten Daten geschatzt werden. 

0 Aus den Grundannahmen des Risiko-Wahl-Modells ergeben sich die bekannten und 

empirisch gepruften Aussagen nur, wenn zusatzliche Annahmen gemacht werden. 

Beispielsweise muss angenommen werden, dass die theoretische Variable der 

resultierenden Tendenz sich monoton auf die Starke der Praferenz von verschiedenen 

Aufgaben auswirkt und dass die theoretische Variable der Erfolgswahrscheinlichkeit 

518 

unmittelbar durch Misserfolge bei ahnlichen Aufgaben abgesenkt wird. 

Wenn die zur Ableitung wesentlicher theoretischer Aussagen aus den Axiomen 
notwendigen Zusatzannahmen lediglich unproblematische und selbstverstandliche 
Hilfsannahmen darstellen wtirden, konnte man sie vernachlassigen und die Standard- 
theorienkonzeption als brauchbare Annaherung beibehalten. Tatsachlich sind die 
zusatzlich notwendigen Annahmen haufig aber so problematisch oder inhaltlich so 
gehaltvoll, dass sie essenzielle Bestandteile der Theorie darstellen und grundsatzlich 
nicht weniger Aufmerksamkeit verdienen als andere Teile des theoretischen 
Systems. Die strukturalistische Theorienkonzeption nimmt deshalb von der 
Vorstellung der Theorien als deduktive Aussagensysteme Abschied und 
berucksichtigt alle bei der Ableitung theoretischer Aussagen wesentlichen 
Annahmen jeweils explizit als spezifische Bestandteile der Theorie. 



• • 

11.2 Strukturalistische Analyse von Theorien: Uberblick 

Aufbau, Funktion und Entwicklung wissenschaftlicher Theorien konnen besonders 
umfassend, systematisch und differenziert mit dem Instrumentarium der 
s trukturalistischen Wissenschaftstheorie beschrieben werden. Diese noch relativ 
junge metatheoretische Konzeption basiert auf Analysen der Struktur physikalischer 
Theorien von Joseph Sneed. 519 Verbreitet wurde sie durch die Schriften von 



518 

519 



Gadenne (1994b, S. 300-301) 
Sneed (1976, 1979) 





Struktur wissenschaftlicher Theorien 



223 



Wolfgang Stegmiiller, einem der bekanntesten deutschsprachigen Wissenschafts- 
philosophen. Wolfgang Balzer und Carlos Ulises Moulines haben die Konzeption 
entscheidend weiterentwickelt. 521 Angewendet worden ist die strukturalistische 
Wissenschaftstheorie inzwischen auf verschiedene Wissenschaftsbereiche von der 
Physik iiber die Biologie und die Okonomie bis zur Psychologie. 522 

Sie wurde zunachst als „Nicht-Aussagen-Konzeption“ (non- statement view) 
bezeichnet, spater dann als strukturalistische Theorienkonzeption ( structuralist view 
of scientific theories ), strukturalistische Wissenschaftstheorie ( structuralist theory of 
science ) oder kurz als Strukturalismus ( structuralism ). Die Bezeichnungen bieten 
allerdings, wegen der Mehrdeutigkeit der Begriffe „Struktur“ und „Strukturalismus“, 
Anlass zu Verwirrungen und Verwechslungen. 

Der Begriff der Struktur bezeichnet ganz allgemein den Aufbau, das Geftige oder 
die Anordnung von Teilen zu einem Ganzen. Dementsprechend besteht in der 
Mathematik, wie wir im Kapitel 6.5 gesehen haben, eine Struktur aus mindestens 
einer Menge von Objekten und mindestens einer Relation zwischen ihnen. 

Als strukturalistisch werden Denkansatze bezeichnet, nach denen „es bei der 
Erforschung eines Gebietes auf die Untersuchung seiner abstrakten Struktur 
ankommt, d.h. auf die Klarung der Beziehungen zwischen seinen einzelnen 
Teilen' 4 . 523 In der strukturalistischen Wissenschaftstheorie wird die Struktur eines 
bestimmten Teils des menschlichen Wissens analysiert: die Struktur von empirisch- 
wissenschaftlichen Theorien. Dabei werden Strukturen im mathematischen Sinn 
benutzt. 

Der wissenschaftstheoretische Strukturalismus muss deutlich von den zahlreichen 
anderen Konzeptionen unterschieden werden, die ebenfalls als „strukturalistisch“ 
bezeichnet werden. Allgemein bekannt sind vor allem der sprach- und 
sozialwissenschaftliche Strukturalismus. 524 Auch in der Geschichte der Psychologie 



~ J Stegmiiller (1979, 1980, 1985, 1986) 

521 Balzer (1982, 1985, 1992, 1997), Balzer, Moulines & Sneed (1987), Balzer & Moulines 
(1996; in print) 

522 Eine erste systematische Anwendung der strukturalistischen Konzeption fiir Theorien 
und Untersuchungen der Psychologie habe ich in dem Buch Strukturalistische 
Theorienkonzeption und empirische Forschung in der Psychologie (Westermann, 
1987a) gegeben, kiirzere Einfuhrungen in mehreren Artikeln (1987c, 1987d, 1988). 
Weitere psychologische Anwendungen: Stephan (1990), Heise (1991, 1998), Gerjets 
(1995) und in den Sammelbanden von Westmeyer (1989a, 1992). 

523 Regenbogen & Meyer (1998, S. 635-636) 

524 Diese Formen des Strukturalismus sind primar ein Produkt der franzosischen 
Geistesgeschichte (Dosse, 1996; Kunzmann et al., 1991, S. 231; Regenbogen & Meyer, 
1998, S. 636; Schiwy, 1984; Strube et ah, 1996, S. 510-512, 691-693). 

Der Strukturalismus der Linguistik geht auf Ferdinand de Saussure zuriick. Sprache 
(langue) ist danach ein (uberindividuelles, soziales und unbewusstes) System von 
abstrakten Zeichen, die wesentlich durch ihre Beziehungen untereinander definiert sind. 
Aus dieser abstrakten Struktur geht das individuelle und konkrete Sprechen ( parole ) 
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finden sich verschiedene Konzeptionen, die als strukturalistisch bezeichnet 
werden. 525 

Em wesentlicher Teil der strukturalistischen Analyse einer wissenschaftlichen 
Theorie besteht darin, die Theorie in der Terminologie der Mengen- und Relations- 
theorie zu rekonstruieren. Eine Rekonstruktion ist eine systematische und verbesserte 
Neuformulierung. Die Rekonstruktion einer Theorie soil einerseits moglichst pra- 
zise, konsistent und sachgerecht sein, andererseits soil das Rekonstrukt den Original- 
darstellungen und -absichten moglichst genau entsprechen. In der Regel sind beide 
Ziele nicht gleichzeitig zu erreichen, so dass Rekonstruktionen von Theorien viele 
Entscheidungen, Kompromisse und Gratwanderungen beinhalten: Soil man Unge- 
nauigkeiten bei den Begriffen beseitigen oder ihre Bedeutung bewusst offen lassen? 
Wie soli man die Liicken im Gefiige der Annahmen schlieBen? In welcher Weise sol- 
len zu schwache Behauptungen prazisiert werden? Mtissen wir zu starke Behaup- 

S97 

tungen abschwachen? 

Bestandteile der Rekonstruktion einer Theorie 

Die strukturalistische Rekonstruktion und Analyse von wissenschaftlichen Theorien 
erfolgt auf verschiedenen Ebenen. 



hervor. Die Bedeutung der Zeichen, das heiBt ihre Beziehungen zu den bezeichneten 
Objekten und Ideen, Merkmalen und Beziehungen beruht auf Konventionen. 

Auf die Ethnologie und Soziologie iibertragen hat diesen Strukturalismus Claude 
Levi-Strauss, der nach Zeichen- und Klassifikationssystemen suchte, die den Denk- und 
Verhaltensgewohnheiten von Naturvolkern zugrunde liegen. Weitere bekannte Vertreter 
strukturalistischer Denkansatze sind der Psychoanalytiker Jacques Lacan und der 

Philosoph und Historiker Michel Foucault. 

525 

Der psychologische Strukturalismus von W. Wundt und insbesondere seinem Schuler 
E.B. Titchener fasst psychische Einheiten (z.B. Wahrnehmungen) als Strukturen auf, 
d.h. als assoziative Bundelungen oder Mosaike einzelner Empfindungen, die durch 
sachverstandige Introspektion beschrieben werden sollten (Hacker & Stapf, 1998, S. 
844). Vor allem die Behavioristen kritisierten, dass diese introspektiven Ergebnisse 
nicht inter subjektiv nachprufbar sind. 

Als Strukturpsychologie wird auBerdem die von W. Dilthey (siehe oben Seite 174) 
begrtindete geisteswissenschaftliche Psychologie bezeichnet, die menschliche Hand- 
lungen hermeneutisch interpretiert und dabei von einer sinnvollen Gliederung des psy- 
chischen Apparates ausgeht (Regenbogen & Meyer, 1998, S. 636). 

Auch die Untersuchungen und Erklarangen der Entwicklung von Denkstrukturen 
durch Jean Piaget werden als strukturalistisch bezeichnet (Gardner, 1984). 

526 Hempel (1972), Kamlah (1980), Stegmuller (1973a, S. 8-15), Scheibe (1988) 

527 

Diese Situation ahnelt der Lage eines Architekten, der ein kunstgeschichtlich wertvolles, 
aber baufalliges Haus rekonstraiert. Er muss einerseits, um modernen Vorschriften und 
Komfortvorstellungen zu gentigen, neue Materialien und Techniken verwenden, 
andererseits das Rekonstrukt aber so originalgetreu wie moglich gestalten. 
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• Zwischen den Theorien einer wissenschaftlichen Disziplin bestehen vielfaltige 
Verbindungen und Beziehungen, die durch intertheoretische Bander beschrieben 
werden konnen. 

• Jede einzelne wissenschaftliche Theorie kann als eine geordnete Struktur 
verschiedener Theorie-Elemente beschrieben und graphisch durch ein Theorie- 
Netz veranschaulicht werden. 

• Das Basiselement dieses Netzes umfasst die Grundannahmen der Theorie, die 
anderen Elemente stellen Erweiterungen fiir verschiedene Anwendungsbereiche 
oder Modifikationen aufgrund abweichender Ergebnisse dar. 

• Jedes Theorie-Element besteht aus einem abstrakten Kern und einer Menge von 
konkreten Situationen, auf die diese abstrakten Begriffe und Zusammenhange 

coo 

angewendet werden sollen. 

• Im abstrakten Kern eines Theorie-Elementes werden die verwendeten Begriffe 
charakterisiert und die angenommenen gesetzesmaBigen Zusammenhange 
spezifiziert. Dies erfolgt in relativ praziser Weise durch informell-mengen- 
theoretische Axiomatisierungen. 

• Die Menge der intendierten Anwendungen besteht aus den paradigmatischen 
Anwendungen (im Sinne von Kuhn, siehe Abschn. 9.3), den iibrigen streng 
geprliften und bewahrten Anwendungen (im Sinne von Popper, siehe Abschn. 
10.2) und den daraus abgeleiteten vermuteten Anwendungen (induktive 
empirische Vermutungen, siehe Abschn. 4.3.2). 

Am besten wird die strukturalistische Wissenschaftstheorie verstandlich, wenn man 

sich mit ihr am Beispiel vertraut macht. Bei den folgenden Darstellungen wird zur 

Illustration und Erlauterung durchgangig auf die Strukturalisierung von Festingers 

Dissonanztheorie Bezug genommen, da die Theorie gut bekannt und von einer 

con 

mittleren Komplexitat ist. 



11.3 Grundlegende Begriffe und Annahmen: das Basiselement einer Theorie 

Das Basiselement eines Theorie-Netzes reprasentiert diejenigen Annahmen der 
Theorie, die in jeder Form und Anwendung der Theorie unbedingt erftillt sein sollen. 

Leon Festinger hat die Grundbegriffe und die Grundannahmen der Dissonanz- 
theorie im ersten Abschnitt seines Buches ausfuhrlich dargestellt. 530 Sie konnen in 
den folgenden vier Aussagen zusammengefasst werden: 

a) Zwischen kognitiven Elementen gibt es drei Arten von Beziehungen: irrelevante, 
dissonante und konsonante. 



528 

529 

530 



Der abstrakte Kern eines Theorie-Elementes hat nichts mit dem harten Kern eines 
Forschungsprogrammes im Sinne von Lakatos zu tun. 

Zugrunde gelegt wird eine formal verbesserte Rekonstruktion (Westermann, in print). 
Festinger (1978, S. 15-42) 
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b) Die Starke der Dissonanz bzw. Konsonanz nimmt in dem MaBe zu, wie die 
Wichtigkeit oder der Wert der betreffenden Elemente zunimmt. 

c) Die gesamte Dissonanz zwischen einem kognitiven Element und den restlichen 
Kognitionen der Person ist abhangig von dem gewichteten Anteil an relevanten 
Elementen, die mit dem fraglichen Element dissonant sind, wobei jede relevante 
Beziehung nach der Bedeutung der an der Beziehung beteiligten Elemente 
gewichtet wird. 

d) Die Prasenz von Dissonanz erzeugt Druck zur Reduktion oder Beseitigung der 
Dissonanz, und die Starke des Drucks zur Dissonanzreduktion ist eine Funktion 
der Starke der Dissonanz. 

Diese Grundbegriffe und Grundannahmen der Theorie werden als Basiselement des 
Theorie-Netzes rekonstruiert. Die spezielleren Begriffe und Annahmen der Theorie 
flihren, wie spater dargestellt wird, zu den anderen Theorie-Elementen des Netzes. 

11.3.1 Potenzielle und tatsachliche Modelle von Theorie-Elementen 

Jede Entitat, also jede Person und jede Personengruppe, fur die die Gesetzes- 
annahmen eines Theorie-Elementes tatsachlich gelten, ist ein tatsachliches Modell 

o t 

dieses Theorie-Elementes. Um untersuchen zu konnen, ob diese Annahmen in 
einem konkreten Anwendungsfall tatsachlich gelten, miissen zunachst die Mengen, 
Relationen und Funktionen, auf die diese Annahmen sich beziehen, hergestellt, 
beobachtet oder gemessen werden. Wenn diese Konzepte identifiziert werden 
konnen, ist ein potenzielles Modell des interessierenden Theorie-Elementes definiert. 

0 Eine Person ist ein potenzielles Modell des Basiselementes der Dissonanztheorie, wenn 
wir sie in der dissonanztheoretischen Begrifflichkeit beschreiben konnen. Dazu miissen 
wir die interessierenden Kognitionen identifizieren und Informationen iiber Dissonanz 
und Wichtigkeit von Kognitionspaaren sowie iiber die Starke der Dissonanz und des 
Reduktionsdrucks bei einzelnen Kognitionen haben. 

0 Ein tatsachliches Modell der Dissonanztheorie ist diese Person nur dann, wenn zwischen 
der Wichtigkeit, Starke und Reduktionsdruck die oben in den Punkten (b) bis (d) 
genannten Beziehungen bestehen. Ist beispielsweise die Dissonanz fur eine Kognition 
groBer als ftir eine andere, muss nach Punkt (d) auch der Reduktionsdruck groBer sein. 

Um genau beschreiben zu konnen, wie eine Entitat beschaffen sein muss, um ein 
potenzielles oder ein tatsachliches Modell des Theorie-Elementes T zu sein, miissen 
wir die Pradikate „ist ein potenzielles Modell von T“ und „ist ein tatsachliches 
Modell von T“ so prazise wie moglich definieren. Dazu verwendet man im Struk- 
turalismus die Methode der mengentheoretischen Axiomatisierung, die bereits im 
Kapitel 6.5 erlautert worden ist. Fur jedes Theorie-Element konnen dadurch die 
Menge M p der potenziellen Modelle und die Menge M der tatsachlichen Modelle 
intensional definiert werden. 



531 



Zum mathematischen Modellbegriff siehe oben Seite 130. 
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Durch die Definition der Menge M p werden alle Begriffe des Theorie-Elements 
mengentheoretisch genau charakterisiert. Durch die Definition der Menge M werden 
die Annahmen als Beziehungen zwischen den Begriffen prazise formuliert. 

Die Bedingungen, die zur Definition der Menge M p dienen, sind terminologische 
Axiome. Die bei der Definition der Menge der Modelle hinzukommenden 
Bedingungen sind substanzielle Axiome. Sie entsprechen den Gesetzesannahmen der 
Theorie. 

Die mengentheoretische Definition von potenziellen und tatsachlichen Modellen 
wird im folgenden Kapitel 11.3.2 am Beispiel des Basiselements der Dissonanz- 
theorie erlautert. Die dabei verwendeten unterschiedlichen Arten von Begriffen 
(Mengen, Relationen, Funktionen) wurden bereits im Kapitel 6 dargestellt. 

Wer an der formellen Ausfiihrung einer strukturalistischen Theorienformulierung 
(noch) nicht interessiert ist, kann die mengentheoretischen Definitionen (zunachst) 
uberfliegen und sich auf die erlauternden Textpassagen beschranken. 

11.3.2 Mengentheoretische Definitionen von (potenziellen) Modellen 

Im folgenden sind zunachst die axiomatischen Definitionen der Menge M p (DissB) 
der potenziellen Modelle und der Menge M(DissB) der tatsachlichen Modelle des 
Basiselements DissB der Dissonanztheorie aufgeflihrt. Die formale Struktur und die 
inhaltliche Interpretation ihrer Bestandteile wird anschlieBend erlautert. Die 
beabsichtigte inhaltliche Interpretation wird bereits durch die gewahlten 
Bezeichnungen fur die Terme dieses Basiselements ausgedriickt. 

Wir beginnen mit der Definition der Menge der potenziellen Modelle. 

(11-1) A e M p (DissB) gdw 

(1) A = {Zeitpunkte, Rohkognitionen, Ko gnitionen, Disskog, Konskog, paardiss, 
paarkons, paarwicht, disstarke, reddruck, konfl, sttitz ) 

(2) Zeitpunkte c P 

(3) Rohkognitionen ± • 

(4) Kognitionen cz Rohkognitionen x Zeitpunkte 

(5) Disskog cz Kognitionen x Kognitionen 
Konskog cz Kognitionen x Kognitionen 
Disskog n Konskog = 0 

(6) paardiss: Disskog — > P 0+ 
paarkons : Konskog — > Po+ 

(7) paarwicht : ( Disskog u Konskog ) — > P 0+ 

(8) disstarke : Kognitionen — > P 0+ 

(9) reddruck : Kognitionen — >P 0+ 

(10 ) konfl: Disskog — > Po+ mit 

konfl { c it ):= E paarwicht{ c it , c kt ) 

Vc kt : (c it ,c kt )e Disskog 
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(11 )stiitz‘. Konskog — > P 0+ mit 

stiitz(c it ):= 2_j paarwicht(c it ,c kt ) 

Vc kt : (c it ,c kt )s Konskog 

Es folgt die Definition der Menge der tatsachlichen Modelle. 

(11-2) A € M(DissB) gdw 

(10) Ae M p (DissB) 

(11) V (c it , c jt ), (c ku , c lu ) e Disskog 

Wenn paarwicht( Cj t , Cj t ) 

Dann paardissic it , Cj t ) 

V (c it , Cj t ), (c ku , c lu ) € Konskog : 

Wenn paarwicht( Cj t , Cj t ) 

dann paarkons( q t , q t ) 

(12) V Ci t , c ju e Kognitionen : 

Wenn hmfl{C “ ) 

konfl( c it ) + stiitz( c it ) 

dann disstarke( c it ) 

(13) V Ci b c ju e Kognitionen : 

Wenn disstdrke(c lt ) 

dann reddruck( C; t ) 

Erlauterungen 

Nach Definition (11-1) muss ein potenzielles Modell des Basiselementes DissB 
neun Bedingungen (Axiome) erfiillen. Nach Axiom (1) ist jedes potenzielle Modell 
von DissB eine Struktur aus zwolf Komponenten. In den Axiomen (2) bis (5) werden 
die ersten fiinf Komponenten als Mengen charakterisiert, in den Axiomen (6) bis (9) 
die anderen sieben Komponenten als Funktionen. 

Nach der Definition (11-2) muss ein tatsachliches Modell von DissB ein 
potenzielles Modell sein (Axiom 10) und die substanziellen Axiome (11) bis (13) 
erfiillen. 

Da die verbale Theoriedarstellung von Kognitionen ausgeht, wurde es nahe 
liegen, die Kognitionen als nicht weiter analysierte Grundmenge einzuftihren. Dann 
konnten wir aber nicht ausdriicken, dass sich die Menge der Kognitionen einer 
Person iiber die Zeit teilweise andert: Einige kommen hinzu, andere verschwinden. 
Deshalb wird der Begriff Kognitionen im Axiom (4) als Untermenge des 
kartesischen Produktes aus einer Grundmenge von Rohko gnitionen (Axiom 3) und 
der Grundmenge der betrachteten Zeitpunkte (Axiom 2) charakterisiert. Die 
Elemente der Menge der Kognitionen werden als c it , c iu , Cj t usw. bezeichnet. Die 
Elemente c it und c iu bezeichnen die gleiche Rohkognition q (z.B. „Ich lese ein 
Statistik-Buch“) zu unterschiedlichen Zeiten t und u (z.B. gestern 20.15 Uhr und 
heute 11 Uhr). Die Elemente c it und q t sind unterschiedliche Rohkognitionen q und 



< paarwicht{ c ku , q u ), 

< paardiss{c ku , q u ) 

< paarwicht( c ku , q u ) 

< paarkons( c ku , q u ) 

konflj c ju ) 
konfl(c iu )+stutz(c iu ) 

< disstdrke( q u ) 

< disstarke( q u ) 

< reddruck( Cj u ) 
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Cj (z.B. „Ich lese ein Statistik-Buch“ und „Im Fernsehen beginnt ein Kriminalfilm“), 
die gleichzeitig bestehen. 

Disskog ist die Kurzbezeichnung fur die Menge aller Paare von Kognitionen, die 
dissonant sind. Konskog bezeichnet die Menge aller konsonanten Kognitionspaare. 

coo 

Beide Mengen mlissen disjunkt sein (Axiom 5). Da nach Festinger die Starke 
dieser Dissonanzen und Konsonanzen von der Wichtigkeit der beteiligten Elemente 
abhangt (siehe oben Annahme b), gibt es drei Funktionen mit den Kurz- 
bezeichnungen paardiss, paarkons und paarwicht (Axiome 6 und 7), die jeweils den 
Kognitionspaaren in ihrem Definitionsbereich eine reelle Zahl fur die Wichtigkeit 
zuordnen. Die Art der Abhangigkeit der paarweisen Dissonanz bzw. Konsonanz von 
der Wichtigkeit wird in der verbalen Theoriendarstellung nicht genauer spezifiziert. 
Vermutlich sind aber monotone Abhangigkeiten gemeint. Diese Annahme ist in 
Axiom 1 1 formuliert. 

In Axiom 9 werden zwei Funktionen konfl und stiitz definiert, die fur jede Kogni- 

tion die paarweisen Wichtigkeiten iiber alle zu ihr dissonanten bzw. konsonanten 

Kognitionen aufsummieren. Sie driicken damit das AusmaB der kognitiven Konflikte 

bzw. der kognitiven Stiitzung aus, das auf die einzelnen Kognitionen entfallt. Nach 

• • 

Festinger ist der Widerstand gegen eine Anderung einer Kognition umso groBer, je 
groBer das AusmaB dieser kognitiven Stiitzung ist. Axiom 12 driickt aus, dass die 
Dissonanzstarken fur einzelne Elemente eine Funktion der gewichteten Anteile von 
paarweisen Dissonanzen und Konsonanzen sind (Annahme c). 

Festingers zentrale Annahme betrifft den Zusammenhang zwischen Dissonanz- 
starke und Reduktionsdruck (siehe oben Punkt d). Diese Annahme bezieht sich nicht 
mehr auf Kognitionspaare, sondern auf einzelne Kognitionen. Deshalb sind die 
entsprechenden Funktionen mit den Kurzbezeichnungen disstarke und reddruck auf 
der Menge der Kognitionen definiert (Axiome 8 und 9). Da Festinger die Art des 
funktionalen Zusammenhangs wiederum nicht spezifiziert hat, unterstellen wir 
erneut, dass ein monotoner Zusammenhang angenommen wird: Je groBer die 
Dissonanzstarke, desto groBer der Reduktionsdruck (Axiom 13). 



11.4 Spezielle Begriffe und Annahmen: Bereichselemente 

Neben den allgemeinen Annahmen im Basiselement beinhalten komplexere Theorien 
speziellere Annahmen, die jeweils nur fur bestimmte Anwendungsbereiche gelten 
sollen. Rekonstruiert werden diese speziellen Annahmen durch Theorie-Elemente, 
die wir als Bereichselemente bezeichnen. 
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In den Axiomen werden stets die Kurzbezeichnungen fur die Begriffe verwendet, im 
Text wegen der besseren Lesbarkeit haufig auch die langeren Bezeichnungen. 
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Fur die Dissonanztheorie beschreibt Festinger vier Anwendungsbereiche : 

• Dissonanz nach Entscheidungen 

• Dissonanz nach einstellungskontraren Verhaltensweisen (forced compliance ), 

• Dissonanz bei Aufnahme und Auswahl von Informationen und 

• Dissonanz bei Meinungsverschiedenheiten in sozialen Situationen. 

Sie konnen als Bereichselemente DissE, DissF, DissI und DissS rekonstruiert werden 
und sind in der Abbildung 11.2 durch fett umrandete Ellipsen unterhalb des Basis- 
elements symbolisiert. Exemplarisch wird das Bereichselement DissF im folgenden 
Kapitel 11.4.1 genauer betrachtet. 




Abbildung 11.2: Wichtige Teile des Theorie-Netzes fur die Dissonanztheorie 

Ein weiterer wesentlicher Bestandteil von Theorie-Netzen sind Theorie-Elemente, 
die Modifikationen der Theorie reprasentieren. Modifikationen der Dissonanztheorie 
sind in der Abbildung 11.2 durch doppelte Umrandungen gekennzeichnet. Einige 
von ihnen werden im Kapitel 1 1.4.2 beschrieben. 

Im Theorie-Netz reprasentiert werden konnen auBerdem die ganz speziellen 
theoretischen Bezugspunkte der verschiedenen empirischen Anwendungen und 
Priifungen der Theorie. Die zahlreichen empirienahen Theorie-Elemente der 
Dissonanztheorie sind in der Abbildung durch einfache Ellipsen symbolisiert. Eines 
dieser Anwendungselemente, DissFI72, wird exemplarisch im Kapitel 11.4.3 
besprochen. 
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Durch entsprechende Netze von Theorie-Elementen lassen sich auch andere 

CTO 

psychologische Theorien rekonstruieren. 

1 1.4.1 F orced-compliance-Dissonanz 

In Forced-compliance-Situationen ist das Wissen um die eigene Einstellung, 
• • 

Uberzeugung oder Meinung dissonant damit, dass man eine andere Meinung offen 
vertreten hat. Nach Festingers Theorie gelten folgende spezielle Annahmen: 

1. Die Dissonanz bei einem einstellungskontraren Verhalten ist umso starker, 

a) je wichtiger die involvierte Meinung oder das ausgeflihrte Verhalten fur die 
Person ist und 

b) je geringer die versprochene Belohnung fur die Einwilligung bzw. die 
angedrohte Bestrafung fur die Nicht-Einwilligung ist. 

2. Je groBer der Druck zur Reduktion bestehender Dissonanz ist, desto mehr wird 

• • 

a) die Wichtigkeit der involvierten Uberzeugungen und Verhaltensweisen ver- 
ringert, 

b) die subjektive GroBe der erhaltenen Belohnung bzw. vermiedenen Bestrafung 
erhoht oder 

• • 

c) die personliche Meinung oder Uberzeugung so geandert, dass der Unterschied 
zur vertretenen Meinung geringer wird. 534 

Diese speziellen Annahmen werden in einem Bereichselement DissF rekonstruiert. 
Bei der folgenden Definition der potenziellen Modelle werden spezielle Funktionen 
(me/nungsnnterschied, wzcMgkeit und belohnung) auf einer Untermenge Meinkon 
von Kognitionen liber einstellungskontrares (forced compliance) Verhalten 
eingefiihrt. Bei der anschlieBenden Definition (11-4) der tatsachlichen Modelle 
werden die angenommenen Zusammenhange zwischen diesen Variablen spezifiziert. 

Da Festinger spezielle Annahmen iiber Zusammenhange zwischen der GroBe des 
Reduktionsdrucks einerseits und der GroBe der Veranderung der subjektiven 
Wichtigkeiten, Belohnungshohen und Meinungen trifft (siehe oben Punkt 2), werden 
neben t und u noch jeweils spatere Zeitpunkte t+ bzw. u+ betrachtet. 

Die speziellen Annahmen der Dissonanztheorie sollen, wie bei wissenschaftlichen 
Theorien tiblich, nur ceteris paribus und probabilistisch gelten. Erstens wird 
angenommen, dass fur alle moglichen Werte jedes Einflussfaktors alle anderen 
bekannten und unbekannten Einflussfaktoren konstant sind oder gleiche 



533 

Explizit als Theorie-Netze rekonstruiert wurden die Kognitionstheorie ACT* (Heise, 
1991, 1992, 1993; Heise & Westermann, 1989), die Rubikontheorie der Handlungs- 
phasen (Gerjets, 1995; Heise, Gerjets & Westermann, 1994), die Handlungstheorie von 
Kuhl (Heise, 1998, 1999), dimensionale Theorien der Emotion (Reisenzein, 1992), 
Erwartungswerttheorien des Nutzens (Stephan, 1989), Theorien der Verhaltens- 
interaktion (Westmeyer, 1989b) und Balancetheorien (Manhart, 1994, 1995). 

534 Festinger (1978, S. 96-102) 
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Wahrscheinlichkeitsverteilungen haben (siehe Kapitel 7.2.4). Zweitens sollen die 
angenommenen Zusammenhange nur mit einer gewissen hohen, aber unbekannten 
Wahrscheinlichkeit gelten (siehe Kapitel 7.1.5). In unserer Axiomatisierung sind 
diese Annahmen durch die Subskripte cp und p symbolisiert. 

(11-3) A e Mp(DissF) gdw 

(1) A — {Zeitpunkte, Rohkognitionen, Kognitionen, Disskog, Konskog, paardiss, 
paarkons, paarwicht, disstdrke, reddruck, konfl, sttitz, Meinkon, meinunt, 
wicht, belohn) 

(2) ( Zeitpunkte , Rohkognitionen, Kognitionen, Disskog, Konskog, paardiss, 
paarkons, paarwicht, disstdrke, reddruck, konfl, sttitz) e M p (DissB) 

(3) Meinkon c Kognitionen 

(4) meinunt : Meinkon — > P 

(5) wicht : Kognitionen —> P (j+ 

(6) belohn : Meinkon — > Po+ 

(11-4) A € M(DissF) gdw 

(7) A e M p (DissF) 

(8) ( Zeitpunkte , Rohkognitionen, Kognitionen, Disskog, Konskog, paardiss, 
paarkons, paarwicht, disstdrke, reddruck, konfl, sttitz) e M(DissB) 

(9) V Cj t , Cj u e Meinkon : 

Wenn cp wicht{ Cj t ) < wicht{ Cj u ) 

v belohn( Cj t ) > belohn( Cj u ) 

dann p disstdrke(cf) < disstdrke( Cj u ). 

(10) V c it , Cj U , c it+ , Cj U+ g Meinkon mit t < t+, u < u+: 



Wenn cp 


0 


< 


redd rue k(c a ) 


< 


reddruck(c jU ) 


dann p 


0 


> 


wicht{ C; t+ ) - wicht(c lt ) 


> 


wicht( Cj U+ ) - vi7'c7?f(c JU ) 


V 


0 


< 


belolm(c a+ ) - belohn(c a ) 


< 


belohn( Cj u+ ) - belohn( Cj u ) 


V 


0 


> meinunt(c a+ ) - meinunt(c a ) 


> 


meinunt(c ]U+ ) - meinunt{ Cj u ). 



Die Definition der tatsachlichen und potenziellen Modelle der Bereichselemente 
DissE, DissI und DissS erfolgt ahnlich und soil hier nicht dargestellt werden. 

11.4.2 Modifikationen der Dissonanztheorie 

In Experimenten zur Dissonanz bei einstellungskontrarem Verhalten zeigten sich 
keineswegs immer die von der urspriinglichen Theorie vorhergesagten Meinungs- 
unterschiede. Sie scheinen nur aufzutreten, wenn die Personen das Verhalten 
freiwillig zeigen und sich offen zu ihm bekennen. Liegen diese Voraussetzungen 
nicht vor, ist der verbleibende Meinungsunterschied haufig umso kleiner, je groBer 
die versprochene Belohnung ist (Verstarkungseffekt). 



535 



Irle & Montmann (1978, S. 325-332) 
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Um diese Befunde theoretisch erklaren zu konnen, wurden verschiedene 
Modifikationen der Dissonanztheorie vorgenommen. Sie nennen verschiedene 
Bedingungen, die notwendig sind, damit tatsachlich kognitive Dissonanz auftritt: 536 

• Nach Brehm und Cohen muss die Person ein Gefiihl der Selbstverpflichtung 
(i commitment ) haben und Handlungs- bzw. Entscheidungsfreiheit empfinden. 

• Nach Aronson muss das Verhalten der Person mit ihrem Selbstkonzept 
inkonsistent sein und das personliche Selbstwertgefuhl tangieren. 

Beide Annahmen entsprechen jeweils einer Modifikation des Bereichselementes 
DissF. Als Beispiel ist in Abbildung 11.2 das Element DissF.S fur die Selbst- 
konzeptannahmen von Aronson eingezeichnet. Da diese modifizierten Dissonanz- 
bedingungen auch fur die anderen Anwendungsbereiche angenommen worden sind, 
ist in der Abbildung auch ein allgemeineres Element DissB.S enthalten, das die 
Erganzung des Basiselements um Aronsons Selbstkonzeptannahmen reprasentiert. 

Durch zusatzliche Theorie-Elemente lassen sich auch andere Modifikationen der 
Grund- oder Bereichsannahmen der Theorie darstellen. 

0 Nach Martin Irle entsteht Dissonanz nur dann, wenn eine Kognition einer Hypothese 

537 

widerspricht, die gut bestatigt ist und im Selbst der Person verankert ist. 

0 Etliche Experimente zeigen, dass nach einer Entscheidung die Attraktivitatsunterschiede 
zwischen gewahlten und nichtgewahlten Alternativen zunachst gar nicht, wie im 
Bereichselement DissE angenommen, groBer werden, sondern sich fiir eine gewisse Zeit 
einander annahern ( regret effect ). 538 

11.4.3 Empirische Anwendungen der Dissonanztheorie 

Auf der untersten Ebene eines Theorie-Netzes sind die Theorie-Elemente 
reprasentiert, die unmittelbar den empirischen Untersuchungen zur jeweiligen 
Theorie zugrunde liegen. 

Aus dem Theorie-Netz der Dissonanztheorie soli ein empirienahes Element exem- 
plarisch beschrieben werden. Das in der Abbildung 11.2 eingezeichnete Element 
DissFI72 reprasentiert die speziellen theoretischen Annahmen des Experiments von 

on 

Dieter Frey und Martin Irle, das 1972 veroffentlicht wurde. 

In dem Experiment wurde die dissonanztheoretische Annahme iiber den 
Zusammenhang zwischen der Hohe der Belohnung fiir ein einstellungskontrares 
Verhalten und dem verbleibenden Meinungsunterschied betrachtet: Je groBer die 



536 Aronson (1968), Brehm & Cohen (1962), Beauvois & Joule (1996); zu weiteren 
Anwendungen, Entwicklungen und Modifikationen der Dissonanztheorie: Beckmann 
(1984), Berkowitz & Devine (1989), Etgen & Rosen (1993), Harmon-Jones & Mills 
(1999), Shultz & Lepper (1996) 

537 Frey (1981), Irle (1975) 

538 Festinger & Walster (1964), Irle & Montmann (1978, S. 309-315) 

539 Frey & Irle (1972, 1978) 
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Belohnung, desto geringer ist die Meinungsangleichung, d.h. desto groBer ist der 
verbleibende Unterscheid zwischen vertretener und tatsachlicher Meinung. Es sollte 
gezeigt werden, dass entsprechend der Theoriemodifikation von Aronson dieser 
positive Zusammenhang zwischen Belohnung und Meinungsunterschied nur dann 
besteht, wenn das Selbstkonzept der Personen tangiert ist. 

Dazu wurden Gymnasiasten veranlasst, einen Aufsatz gegen die Senkung des 
Wahlalters schreiben, obwohl sie deutlich fur die Senkung waren. Fur dieses 
einstellungskontrare Verhalten wurden ihnen entweder 1 DM oder 8 DM bezahlt. 
AuBerdem wurde einem Teil der Schuler gesagt, dass die Aufsatze mit Namens- 
nennung veroffentlicht werden, sie die Mitarbeit aber verweigern konnen. Bei einem 
anderen Teil der Schuler wurde die Freiwilligkeit nicht explizit betont, es wurde 
ihnen aber Anonymitat zugesichert. 540 

Die potenziellen und tatsachlichen Modelle des experimentellen Theorie- 
Elements DissFI72 werden im folgenden definiert und anschlieBend erlautert. Dabei 
soil vor allem verdeutlicht werden, wie empirische Befunde theoretisch 
vorhergesagt, interpretiert und erklart werden. Zur Veranschaulichung dient die 
Abbildung 11.3. 

(11-5) A € M p (DissFI72) gdw 

(1) A = {Zeitpunkte, Rohkognitionen, Kognitionen, Disskog, Konskog, paardiss, 
paarkons, paarwicht, disstarke, reddruck, konfl, stiitz, Meinkon, Selbsttang, 
meinunt, belohn) 

(2) ( Zeitpunkte , Rohkognitionen, Kognitionen, Disskog, Konskog, paardiss, 
paarkons, paarwicht, disstarke, reddruck, konfl, stiitz, Meinkon, meinunt, 
wicht, belohn) e M p (DissF) 

(3) Selbsttang c Kognitionen. 



( 11 - 6 ) 

(4) 

(5) 

( 6 ) 



A e M(DissFI72) gdw 
A e M p (DissFI72) 

V Cj t , Cj t e Meinkon : meinunt(c A ) = meinunticf > 0 

V Cj t , Cj t e Meinkon n Selbsttang: 



Wenn 

dann. 



cp 



belohn(c a ) 
disstarke( Ci t ) 



< 

> 



belohn( Cj t ) 
disstarke( Cj t ). 



(7) V Ci t , c it+, Cjt, Cj t+ e Meinkon n Selbsttang mit t < t+: 



Wenn 

dann,. 



cp 



reddruck{ c, t ) 
meinunt(c a+ ) 



> 

< 



(8) V C;t, Cjt, Cjt, Cj t+ e Meinkon/Selbsttang: 



Wenn 

dann,. 



cp 



belohn( C; t ) 
meinunt{c A+ ) 



< 

< 



reddruck{ Cj t ) 
meinunt{ Cj t+ ). 

belohn( Cj t ) 
meinunt{ Cj t+ ). 



540 Der resultierende Versuchsplan mit zwei Faktoren (Belohnungshohe und 
Offentlichkeit/Entscheidungsfreiheit), jeweils zwei Auspragungen und vier Behand- 
lungsbedingungen wird spater genauer besprochen (Tabelle 12.7 auf Seite 285). 
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In diesen Axiomen sind c it und c it+ die Kognitionen iiber das einstellungskontrare 
Verhalten vor und nach dem einstellungskontraren Verhalten bei der geringen 
Belohnung; Cj t und Cj t+ sind die entsprechenden Kognitionen bei der hohen 
Belohnung. Aufgrund von Vorbefragungen wird vorausgesetzt, dass die Schuler 
tatsachlich eine positive Meinung zur Senkung des Wahlalters haben, dass der 
Meinungsunterschied also fur alle Personen positiv ist (Axiom 5). 

Nach der Theoriemodifikation von Aronson ist die Kognition iiber das 
einstellungskontrare Verhalten selbstwerttangierend, wenn die Schuler die Aufsatze 
freiwillig schreiben und offentlich vertreten. Fur diese Bedingung werden folgende 
theoretische Annahmen gemacht (siehe linken Teil der Abbildung 11.3): 



Offentlichkeit mit Entscheidungsfreiheit 

EO+ 



DissB 




DissF.FI72 
Axiom 6 



DissF.FI72 
Axiom 7 





+ 










— 




belohn 




meinunt 






belohn 




meinunt 



Anonymitat ohne Entscheidungsfreiheit 

EO- 




+ 



DissF.FI72 
Axiom 8 



Abbildung 11.3: Empirische und theoretische Zusammenhange im Dissonanz- 

Experiment von Frey und Irle 

(1) Je kleiner die Belohnung ist, desto groBer ist die Dissonanz (Axiom 6, in der 
Abbildung 11.3 durch den linken vertikalen Pfeil veranschaulicht). 541 

(2) Je groBer die Dissonanz ist, desto groBer ist der Reduktionsdruck (zentrale 
Annahme im Basiselement, linker oberer Pfeil). 542 

(3) Je groBer der Reduktionsdruck ist, desto kleiner ist der verbleibende Meinungs- 
unterschied (Axiom 7, vertikaler Pfeil in Abbildung 11.3). 



541 Axiom 6 in (11-6) ergibt sich aus Axiom 9 der Definition (11-4) der Modelle von 
DissF, wenn der Pramissenteil zur Funktion Wichtigkeit fortgelassen wird. 

542 

Axiom 13 der Definition (1 1-2) der Modelle des Basiselements 
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Insgesamt wird somit die Vorhersage abgeleitet, dass der Meinungsunterschied umso 

geringer wird, je kleiner die Belohnung ist (Dissonanz-Effekt, linker unterer Pfeil in 

der Abbildung 11.3). Diese theoretische Vorhersage wurde im wesentlichen durch 

• • 

die Daten bestatigt: In der Bedingung mit Offentlichkeit und Entscheidungsfreiheit 
glichen die Schuler ihre Meinung bei geringer Belohnung starker ihrem Verhalten 
an. 

• • 

Ohne Hinweis auf Offentlichkeit und Freiwilligkeit ist dagegen nicht zu erwarten, 
dass das Selbstkonzept tangiert wird. Damit ist nach der Theoriemodifikation von 
Aronson auch keine Dissonanz zu erwarten. Vielmehr ist unter dieser Bedingung, so 
die Hypothese der Autoren, eine Verstarkung stheorie der Einstellungsanderung 
gtiltig, die auf der Theorie des operanten Lernens von Skinner beruht. Diese zweite 
theoretische Bezugslinie des Experimentes von Frey und Irle ist im Theorie-Netz in 
der Abbildung 11.2 durch die Theorie-Elemente VST und OPR reprasentiert. Im 
rechten Teil der Abbildung 11.3 ist die verstarkungstheoretische Argumentation 
schematisch dargestellt. Eine hohere Belohnung ist eine groBere Verstarkung fiir die 
(einstellungskontrare) MeinungsauBerung. Je groBer die Verstarkung fiir ein 
Verhalten ist, desto groBer ist nach Grundprinzip der operanten Konditionierung die 
Wahrscheinlichkeit, dass es wiederholt wird (rechter oberer Pfeil). Die nach dem 
Aufsatzschreiben erfasste Meinung ahnelt danach bei hoherer Belohnung starker der 
geauBerten Meinung. Je groBer die Belohnung ist, desto geringer wird also der 
Meinungsunterschied. Diese Hypothese entspricht Axiom 8 in (11-6) und ist rechts 
unten in Abbildung 1 1.3 schematisiert. Durch die Daten wurde sie gut bestatigt. 

Holismus 

Die strukturalistische Analyse eines psychologischen Experiments macht deutlich, 
dass empirische Hypothesenprlifungen stets holistisch sind: Wir konnen nicht 
einzelne Zusammenhangsannahmen isoliert iiberprufen, sondern nur Geftige von 
Annahmen als Ganzes. 544 Dazu gehoren zum einen die Zusammenhangsannahmen, 
die in den substanziellen Axiomen der speziellen Theorie-Elemente und des Basis- 
Elements formuliert sind. Zum anderen werden eine ganze Reihe von expliziten und 
impliziten Zusatzannahmen mit iiberpruft, beispielsweise tiber die adaquate Messung 
der abhangigen Variablen oder liber die Gruppengleichheit zum Ausgangszeitpunkt. 

Wenn die empirischen Ergebnisse den theoretisch begriindeten Erwartungen 
entsprechen, kann die untersuchte Situation insgesamt als Modell des komplexen 
Theorie-Elementes beschrieben werden. Weichen die Daten systematisch von den 
Erwartungen ab, ist das Theorie-Element als Ganzes nicht geeignet, den untersuchten 



543 

Axiom 7 aus (11-6) ergibt sich aus Axiom 10 in Definition (11-4), wenn die Konklu- 
sionsteile zu Wichtigkeit und Belohnung fortgelassen werden und gemaB Axiom 5 
meinunt (ci t ) = meinunt (cj t ) gesetzt wird. 

544 Dieser Holismus wurde vor allem von Quine betont und wird als Duhem-Quine-These 
bezeichnet (Gadenne, 1998b; Gahde, 1996; Stegmtiller, 1987b, S. 265-269). 
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Anwendungsfall zu beschreiben und zu erklaren. Es ist aber meist nicht moglich, 
eindeutig zu klaren, welche der Annahmen zu den Abweichungen geftihrt haben. 

Anwendung in naturlichen Situationen 

Eine wissenschaftliche Theorie mit kausalen Theorie-Elementen kann nicht nur in 
wissenschaftlichen Experimenten angewendet werden, sondern approximativ auch in 
„natiirlichen“, „alltaglichen“, das heiBt nicht kiinstlich hergestellten Situationen . 545 

0 Die Dissonanztheorie kann bei der Planung einer Werbekampagne fur einen Konsum- 
artikel oder bei der klinischen Einzelfallarbeit angewendet werden. 

Die spezifischen theoretischen Bezugspunkte derartiger „nattirlicher“ Anwendungen 
konnen auch durch spezielle empirienahe Theorie-Elemente rekonstruiert werden, 
die sich von den bisher eingefiihrten Theorie-Elementen in einem wichtigen Punkt 
unterscheiden: Sie enthalten keine Ceteris-paribus-Bedingungen, sie stellen also 
keine kausalen GesetzmaBigkeiten dar, sondern lediglich Zusammenhange (Kovaria- 
tionen) zwischen Variablen. 

0 Ein spezielles Forced-compliance-Element fur naturliche Verkaufssituationen kann die 
folgende Annahme enthalten: Hat man Konsumenten durch Teilnahme an einem Preis- 
ausschreiben dazu gebracht, gegen ihre Uberzeugung oder Gewohnheit ein bestimmtes 
Produkt zu kaufen, so wird sich die Meinung zu diesem Produkt umso starker zum 
Positiven hin verandern, je geringer die Gewinne sind. Es wird also eine positive 
Assoziation von Gewinnhohe und Meinungsunterschied vorausgesagt, der in anderen 
Forced-compliance-Theorie-Elementen angenommene kausale Zusammenhang zwischen 
Belohnungshohe und Meinungsunterschied muss jedoch nicht unterstellt werden. 

Die Elimination der Ceteris-paribus-Bedingungen ist notwendig, weil in nicht- 
experimentellen Situationen andere Faktoren nicht gleich (oder gleichverteilt) sind. 

0 An welchen Preisausschreiben (mit unterschiedlichen Gewinnen) Konsumenten teil- 
nehmen oder nicht, kann nicht zufallig bestimmt werden. Die Gruppen unterscheiden sich 
deshalb in vielen Merkmalen: nicht nur in den ausgesetzten Gewinnen, sondern auch in 
den personlichen Einstellungen, Merkmalen und Vorerfahrungen. 

Wahrend man bei der Anwendung eines kausalen Theorie-Elements im Experiment 
die Konstanz aller nicht primar interessierenden Bedingungen annehmen kann, sollte 
man zur Beschreibung und Erklarung einer naturlichen Situation Theorie-Elemente 
verwenden, die moglichst viele der relevanten Einflussfaktoren einbeziehen. 



545 



Der wesentliche Unterschied zu experimentellen Situationen besteht darin, dass die 
Untersuchungseinheiten den Auspragungen der UV nicht zufallig zugeordnet sind. 
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11.5 Intratheoretische Relationen 

Die Elemente eines Theorie-Netzes konnen in verschiedenen Beziehungen zuein- 
ander stehen. Um sie darzustellen, konnen auf der Menge der Theorie-Elemente 
verschiedene Relationen definiert werden. Die Wichtigsten von ihnen haben wir 
implizit schon bei der Beschreibung der Theorie-Netze in den vorangegangenen 
Kapiteln kennen gelernt: Spezialisierungen, Erweiterungen und Vereinfachungen. 
Diese Relationen sind Spezialfalle einer generellen Relation, die hier als Diffe- 
renzierung bezeichnet werden soli. 546 

• Ein Theorie-Element T 2 ist eine Differenzierung eines Elementes TV wenn T 2 
zahlreichere oder spezifischere Zusammenhangsannahmen enthalt als TV 

In diesem Fall ist es schwieriger, die substanziellen Axiome von T 2 als von Ti zu 
erfullen. Die Menge der Modelle von T 2 ist deshalb kleiner als die von TV 

Da eine derartige Differenzierung auf unterschiedliche Weise erfolgen kann, 
konnen wir verschiedene Spezialfalle der Differenzierungsrelation unterscheiden: 
Spezialisierungen, Erweiterungen, Vereinfachungen und Kombinationen dieser 
Differenzierungen. 

• T 2 ist eine Spezialisierung von TV wenn T 2 in der gleichen Begrifflichkeit wie T! 

547 

zusatzliche oder strengere Anforderungen formuliert. 

0 Wenn das Bereichselement flir Dissonanz nach Entscheidungen (DissE) dahingehend 
modifiziert wird, dass nach der getroffenen Entscheidung die Attraktivitatsunterschiede 
zwischen gewahlter und abgelehnter Alternative zunachst konvergieren und dann 
divergieren ( regret effect , siehe Seite 233), ist das entsprechende Theorie-Element 
DissE.R eine Spezialisierung von DissE. 

• T 2 ist eine Erweiterung von T 1? wenn in T 2 zusatzliche Annahmen unter 
Beteiligung zusatzlicher Begriffe formuliert werden. 548 



546 Zur genauen Definition dieser (teilweise unterschiedlich benannten) Relationen: 
Westermann (1989, S. 42), Diederich (1981, S. 182-190), Stephan (1989, S. 99). 

547 

Die Mengen der potenziellen Modelle von Ti und T 2 sind dann gleich. Die Menge der 
tatsachlichen Modelle von T 2 ist eine Untermenge der Menge der tatsachlichen Modelle 
von Ti. Die Hauptvertreter des Strukturalismus bemuhen sich, alle wissenschaftlichen 
Theorien durch Netze von Theorie-Elementen zu rekonstruieren, zwischen denen 
ausschlieBlich Spezialisierungsrelationen bestehen und fuhren deshalb moglichst viele 
Begriffe schon im Basiselement ein (Balzer et al., 1987, S. 170). Die standigen 
terminologischen Erweiterungen, die fur wissenschaftliche Theorien aus alien Bereichen 
typisch sind, konnen dadurch jedoch nicht adaquat abgebildet werden. 

548 In diesem Fall kann die Menge der tatsachlichen Modelle von T 2 auf eine Untermenge 
der Menge der tatsachlichen Modelle von reduziert werden: Streichen wir aus den 
tatsachlichen Modellen von T 2 die zusatzlichen Terme heraus, sind die entstehenden 
Strukturen jeweils tatsachliche Modelle von Ti. 
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0 Die Bereichselemente (z.B. DissE) sind Erweiterungen der Basiselemente, weil 
zusatzliche (nicht-T-theoretische) Begriffe eingefuhrt und neue Zusammenhangs- 
annahmen getroffen werden. 

0 Die Modifikationselemente der Dissonanztheorie (z.B. DissB.S und DissF.S) ergeben 
sich aus den urspriinglichen Elementen (DissB bzw. DissF), indem ein Mengenbegriff 
(hier: der Begriff Selbsttang der selbstkonzepttangierenden Kognitionen) hinzugefiigt 
wird und die substanziellen Axiome auf diese Untermenge eingeschrankt werden. 

• T 2 ist eine Vereinfachung von T b wenn aus T| Begriffe und die entsprechenden 
Zusammenhangsannahmen fortgelassen werden. 549 

0 Die Bereichselemente (z.B. DissF) beziehen sich jeweils auf mehrere Determinanten der 
Dissonanzstarke und mehrere Manifestationen des Reduktionsdrucks (z.B. meinunt, 
wicht, belohn). Jedes Theorie-Element, das nur eine Determinante und eine Manifestation 
betrifft (z.B. belohn und meinunt ) ist eine Vereinfachung von DissF. 

Im Theorie-Netz in Abbildung 11.2 sind die Differenzierungsrelation und ihre 
Spezialfalle durch Linienverbindungen dargestellt. Sind die Elemente T! und T 2 
durch eine einfache Linie verbunden und steht T 2 rechts unter T,, so ist T 2 eine 
Erweiterung von T ( . Steht T 2 hingegen rechts oberhalb von T h so ist T 2 eine 
Vereinfachung von Tj. Eine Spezialisierung ist durch eine doppelte Linie verdeut- 
licht. 

Einige Elemente im Theorie-Netz, insbesondere die empirienahen, entstehen 
dadurch, dass ein Bereichselement zunachst vereinfacht und dann differenziert wird. 

0 DissFI72 ergibt sich aus einer Vereinfachung des modifizierten Bereichselements 
DissF.S, die sich nur noch auf die Variablen belohn und meinunt bezieht (in Abbildung 
11.2 durch einen Punkt angedeutet). Da DissFI72 noch zusatzliche Annahmen enthalt 
(z.B. liber die Meinung der Personen vor der Untersuchung), ist es eine Spezialisierung 
dieser Vereinfachung. 



11.6 Intertheoretische Relationen 

Im vorangegangenen Kapitel haben wir Beziehungen zwischen Theorie-Elementen 
innerhalb eines Theorie-Netzes betrachtet (mtratheoretische Verbindungen). Nicht 
minder wichtig fur die Wissenschaft sind Beziehungen zwischen verschiedenen 
Theorien. Sie werden als mtertheoretische Relationen bezeichnet. 

Globale Relationen und lokale Bander 

Beziehungen zwischen ganzen Theorien werden als globale intertheoretische 
Relationen bezeichnet. Von Wissenschaftsphilosophen wird vor allem untersucht, ob 



549 



Das „alte“ Element Ti ist dann formal eine Erweiterung des „neuen“ Elements T 2 . 
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Theorien begrifflich oder empirisch Equivalent sind, ob eine Theorie auf eine andere 
reduziert werden kann oder ob sie durch die andere approximiert werden kann. 550 

Die globalen Theoriebeziehungen beruhen auf lokalen intertheoretischen 
Relationen, d.h. auf Verbindungen, die zwischen einzelnen Begriffen oder 
Annahmen aus verschiedenen Theorien bestehen. Diese lokalen Relationen werden 
im Strukturalismus durch intertheoretische Bander ( intertheoretical links ) zwischen 
Theorie-Elementen aus verschiedenen Theorie-Netzen rekonstruiert. 551 

Sind verschiedene Theorie-Netze durch intertheoretische Bander miteinander 
verkntipft, sprechen wir von einem Theorie-Holon. 

Determinierende und interpretative Bander 

Die fur uns wichtigen intertheoretischen Bander sind die interpretativen und die 

CCT 

determinierenden Bander. Interpretative Bander dienen dazu, die Bedeutung von 
Begriffen aus einer Theorie durch Verweis auf eine andere Theorie zu spezifizieren. 
Bei determinierenden Bandern geht man noch einen Schritt weiter: Durch 
Verkntipfung mit der anderen Theorie bestimmt man die genauen Werte, die eine 
Funktion annimmt bzw. die konkreten Objekte, die zu einer Relation oder Menge 
gehoren. 

Interpretative Bander spielen bei der Anwendung und Priifung von Theorien eine 
wichtige Rolle. Sowohl die Grundbegriffe einer Theorie, die im Basiselement ein- 
gefiihrt werden, als auch die Begriffe, die in den Bereichselementen hinzukommen, 
werden in ihrer Bedeutung nicht innerhalb der Theorie und nicht durch die Theorie 
festgelegt. Bei der Anwendung und Priifung einer Theorie wird deshalb haufig auf 

co 

andere Theorien zurlickgegriffen, um diese Begriffe zu interpretieren. 

Intertheoretische Bander konnen deskriptiv und praskriptiv verwendet werden. 
Zum einen kann man mit ihnen die iiblicherweise bei der Anwendung einer Theorie 
vorgenommenen Riickgriffe auf andere Theorien beschreiben. Zum anderen konnen 
wir neue intertheoretische Bander formulieren, um Theorien gezielt zu verbessern. 

Intertheoretische Bander fiir die Dissonanztheorie 

Die fiir das Basiselement der Dissonanztheorie zentralen Begriffe der Kognitionen 
und Rohkognitionen konnen in ihrer Bedeutung dadurch prazisiert werden, dass wir 
sie mit entsprechenden Begriffen aus dem Basiselement ACT*-B der Kognitions- 



550 Balzer, Moulines & Sneed (1987, S. 247-385), wo dariiber hinaus auch noch die 
Spezialisierung und die Theoretisierung von Theorien besprochen wird. 

551 Balzer, Moulines & Sneed (1987, S. 57-62) 

552 

Moulines (1992), Moulines & Polanski (1996), dort werden neben determinierenden 

Bandern auch implikative Bander (entailment links ) beschrieben. 

553 

Jede Theorie T verfligt liber einige Begriffe, deren Bedeutung sich ausschlieBlich aus ihr 
selbst ergeben und die als T-theoretische Begriffe bezeichnet werden (siehe unten 
Kapitel 1 1.7). Sie konnen deshalb nicht mit anderen Theorien verbunden werden. 
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theorie ACT* verknlipfen. 554 Die Grundmenge Rohkognitionen in DissB kann mit 
der Grundmenge der kognitiven Einheiten ( cognitive units ) in ACT* verknlipft 
werden. Die Menge der tatsachlichen Kognitionen wird mit dem deklarativen 
Gedachtnis (Menge DM der declarative memory units ) in ACT* verknlipft. 555 Nach 
dieser Verkniipfung konnen alle weiterflihrenden Aussagen, die ACT* liber 
Kognitionen macht (z.B. iiber Starken, Aktivationen, gegenseitigen Verbindungen), 
zur Interpretation und Erklarung dissonanztheoretischer Befunde herangezogen 
werden. 556 

Der fiir das Bereichselement DissF wichtige Begriff des Meinungsunterschieds 
kann durch eine Verbindung mit der Einstellungstheorie von Martin Fishbein und 
leek Ajzen praziser interpretiert und erfasst werden. Nach dieser Theorie ist die 
Einstellung ( attitude ) zu einem Objekt (oder einer Person, einer Idee, einem 

CC7 

Verhalten usw.) gleichbedeutend mit der Gesamtbewertung dieses Objekts. 

Abhangig ist diese Einstellung von den Uberzeugungen ( beliefs ) der Person dariiber, 

welche Attribute dieses Objekt hat, und von ihren Bewertungen dieser Attribute. Die 

in dissonanztheoretischen Untersuchungen betrachteten „Meinungen“ entsprechen 

• • 

eher „Einstellungen“ als „Uberzeugungen“. Es ist also sinnvoll, ein interpretatives 
Band zwischen dem Begriff des Meinungsunterschieds in Festingers Dissonanz- 
theorie und den Einstellungsunterschieden in der Theorie von Fishbein und Ajzen zu 
formulieren. AuBerdem konnen Einstellungen auf der Basis dieser Theorie 
quantitativ erfasst werden: zum einen liber direkte Einschatzungen auf bewertenden 
Dimensionen, zum anderen durch Erfassung und Kombination von Uberzeugun- 
gen. 558 Verwenden wir die Ergebnisse innerhalb der dissonanztheoretischen Be- 
schreibungen und Erklarungen, haben wir ein determinierendes Band. 

Bander zwischen Handlungs- und Kognitionstheorien 

Intertheoretische Bander konnen auch verwendet werden, um Theorien, die getrennt 
entwickelt, dargestellt und angewendet wurden, gezielt miteinander zu verbinden. 
Besonders notwendig und erfolgversprechend ist eine derartige Verbindung 
zwischen Handlungstheorien einerseits und Kognitionstheorien andererseits. 559 



554 Zur strukturalistischen Rekonstruktion von ACT* siehe Heise (1991). 

555 Beide Begriffe sind als Untermengen des kartesischen Produkts der Grundmenge an 
Kognitionen (. Rohkognitionen bzw. cognitive units ) mit der Zeit charakterisiert. 

556 Formal ist ein intertheoretisches Band eine Untermenge des kartesischen Produktes der 
Mengen potenzieller Modelle der Theorie-Elemente. Im Beispiel kann das Band L kurz 
wie folgt formuliert werden: 

(x,y) e L c M p (DissB)xM p (ACT*-B) <-> Rohkognitionen cCha Kognitionen c DM. 

557 Fishbein & Ajzen (1975) 

558 Eine Methode zur Einstellungsmessung durch direkte Bewertungen ist das semantische 
Differential, eine indirekte Erfassung von Einstellungen erfolgt z.B. durch die 
verbreiteten Likert-Skalen (Fishbein & Ajzen, 1975; Westermann, 1982, 1983a). 

559 Westermann & Heise (1996), Gerjets (1995) 
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Psychologische Handlungstheorien finden wir vor allem in der Sozial-, Moti- 
vations- und Arbeitspsychologie. 560 Sie beschreiben zielgerichtetes menschliches 
Verhalten auf einem relativ hohen, „molaren“ Niveau. Sie verwenden Begriffe wie 
Ziele, Wlinsche, Entscheidungen, Intentionen, Plane und Motive. Diese entsprechen 
zumindest zum Teil bewusst zuganglichen Prozessen und Zustanden. 

Psychologische Kognitionstheorien finden sich vor allem in der Allgemeinen 
Psychologie. 561 Sie analysieren menschliches Denken und Handeln auf einem relativ 
niedrigen, „molekularen“ Niveau. Sie verwenden Begriffe wie Representation, 
Schema, Aktivation, Netzwerk und Produktion. Diese entsprechen zumeist nicht 
bewusst zuganglichen Prozessen und Zustanden. 




Abbildung 11.4: Verkniipfung von Rubikontheorie und ACT*-Theorie: 

grundlegende Bander 

Menschliche Aktivitaten werden von Handlungs- und Kognitionstheorien demnach 
auf unterschiedlichen Ebenen und Auflosungsgraden beschrieben. Zwischen beiden 
Ebenen miissen jedoch systematische Relationen bestehen: Handlungen miissen 
kognitiv realisiert werden. Um diese moglichen Realisationsbeziehungen zu 
beschreiben, haben wir intertheoretische Bander zwischen Begriffen der 



560 z.B. Cranach, Kalbermatten, Indermiihle & Gugler (1980), Heckhausen (1989), Hacker 
(1997) 

561 z.B. Anderson (1996a), Dorner (1987), Holland et al. (1986) 
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C/: r% 

Rubikontheorie und der ACT*-Theorie formuliert. “ Sie sind in der Abbildung 11.4 
veranschaulicht. 

Erstens wird zwischen der motivation der verschiedenen Ziele und der starke der 
entsprechenden Zielkognitionen ein monotoner Zusammenhang angenommen, 
zweitens zwischen der volition der Intentionen und der aktivation der kognitiven 
Zieleinheiten. 

Durch diese Zuordnung von Begriffen ergibt sich auch eine Zuordnung von 
Gesetzesannahmen aus beiden Theorien: Nach der Rubikontheorie besteht zwischen 
Motivationsstarke und Volitionsstarke ein monotoner Zusammenhang („Je groBer 
die Motivation, desto groBer die Volition“). Nach der ACT*-Theorie besteht ein 
monotoner Zusammenhang zwischen der Starke und der Aktivation einer deklara- 
tiven kognitiven Einheit. Nach der Verknupfung der Theorien stellt damit der kogni- 
tionspsychologische Zusammenhang (auf der unteren Ebene) eine Realisierung und 
Erklarung des handlungspsychologischen Zusammenhangs (obere Ebene) dar. 



11.7 Theoretische Begriffe und empirischer Gehalt 

Die Mengen der potenziellen und tatsachlichen Modelle sind die wichtigsten 
Bestandteile des Kerns eines Theorie-Elementes. Zu einer umfassenden Rekonstruk- 
tion eines Theoriekerns gehoren dariiber hinaus die Bander (links) zu anderen Theo- 
rien, die im Kapitel 11.6 analysiert wurden, und eine Trennung der theoretischen von 
den nicht-theoretischen Begriffen, auf die dieses Kapitel eingeht. 563 

11.7.1 Theoretische und nicht-theoretische Begriffe 

In der Zweisprachenkonzeption des logischen Empirismus (siehe Kapitel 11.1) 
gehoren zur theoretischen Sprache diejenigen Begriffe, deren Bedeutung sich nicht 
vollstandig aus beobachtbaren Objekten, Eigenschaften und Relationen ergibt. In der 
strukturalistischen Wissenschaftstheorie wird die Klasse der theoretischen Begriffe 
enger und praziser gefasst. Ob ein Begriff theoretisch ist, hangt von seiner Funktion 
in der Theorie und ihren Anwendungen ab. Deshalb erfolgt die Klassifikation als 
theoretisch nicht mehr generell, sondern spezifisch fur jede einzelne Theorie. 

Allgemein gesagt ist ein Begriff „theoretisch in Bezug auf die Theorie T“ (kurz: 
T-theoretisch), wenn er spezifisch fur diese Theorie ist und wenn seine Bedeutung 



562 Gerjets (1995), Gerjets, Heise, Graw & Westermann (1996), Gerjets, Heise & 
Westermann (1995) 

563 

Zum Theoriekern gehoren auBerdem die Eindeutigkeits- oder Querverbindungen 
(Constraints): notwendige, meist aber implizite Annahmen liber Konstanzen oder 
erlaubte Variationen von Funktionswerten liber verschiedene Anwendungen des 
gleichen Theorie-Elements (Balzer et al., 1987, S. 40-47; Stegmiiller, 1985, S. 81-87; 
Stegmiiller, 1986, S. 56-67; Westermann, 1987a, S. 25-29). 





244 



Kapitel 11 



wesentlich von ihrer Giiltigkeit abhangt. Das ist dann der Fall, wenn man bei alien 
bekannten und akzeptierten Bestimmungsmethoden fiir diesen Begriff die Giiltigkeit 
der Theorie T (in mindestens einem Anwendungsfall) voraussetzen muss. 564 

Das strukturalistische Theoretizitatskriterium ist ein stark pragmatisches 
Kriterium. Die Bezeichnung eines Begriffs als T-theoretisch ist stets davon 
abhangig, welche Methoden bekannt und akzeptiert sind, um festzustellen, welche 
Objekte unter diesen Begriff fallen oder welche Auspragungen das bezeichnete 
Merkmal hat. Durch dieses Kriterium werden also keine logischen Wahrheiten 
festgestellt, sondern beschrieben, wie die Vertreter einer Theorie T (gegenwartig) 
mit ihr umgehen. 

Eingefiihrt werden T-theoretische Begriffe meist im Basiselement der Theorie. 

0 Theoretisch in Bezug auf die Dissonanztheorie (kurz: Diss-theoretisch ) sind die zentralen 
Begriffe disstdrke und reddruck, denn in der dissonanztheoretischen Forschung gibt es 
keine allgemein akzeptierten Methoden, diese Variablen direkt und unabhangig von der 
Giiltigkeit der Theorie zu erfassen. 

Zu den nicht-T-theoretischen Begriff en gehoren notwendigerweise alle Grund- 
mengen der Theorie T, da diese gerade dadurch gekennzeichnet sind, dass sie inner- 
halb der Theorie nicht auf andere Begriffe zuriickgefiihrt werden. 

0 Grundbegriffe der Dissonanztheorie und damit nicht-Diss-theoretisch sind die Mengen- 
begriffe Zeitpunkte und Rohkognitionen . 

Auch die Begriffe der Theorie, auf die sich die empirischen Untersuchungen zu 
dieser Theorie unmittelbar beziehen, sind immer nicht-T-theoretische Begriffe. In 
der Psychologie handelt es sich dabei oft um Begriffe, die erst in den Bereichs- 
elementen oder noch spezielleren Theorie-Elementen eingefiihrt worden sind. 

0 Im Experiment von Frey und Irle werden empirisch die Belohnungshohe und das AusmaB 
des Me/nungswnterschieds betrachtet. Die Variable Belohnungshohe ist relativ direkt 
beobachtbar. Um individuelle Meinungen und Meinungsunterschiede valide zu erfassen, 
muss man hingegen beispielsweise auf die Einstellungstheorie von Fishbein und Ajzen 
und auf die Likert-Methode zur Skalenkonstruktion zuriickgreifen. 566 

Die Ableitung empirisch priifbarer Vorhersagen und die einheitliche Interpretation 
beobachtbarer Zusammenhange zwischen verschiedenen nicht-T-theoretischen 
Variablen erfolgt mit Hilfe von Annahmen liber gesetzmaBige Zusammenhange von 



Sneed (1979, S. 31-33), Stegmiiller (1985, S. 45-75), Balzer, Moulines & Sneed (1987, 
S. 62-73). Neben diesem informellen Kriterium sind im Strukturalismus auch formelle 
Theoretizitatskriterien entwickelt worden (Balzer, 1996; Balzer et al., 1987, S. 73-78), 
die jedoch fiir die Psychologie nicht so sinnvoll anwendbar sind. 

565 Auch die anderen wichtigen Begriffe erweisen sich als nicht-Diss-theoretisch: die 
Kognitionen, die Untermengen Disskog und Konskog und die Funktion paarwicht. 

566 siehe oben FuBnote 558, Seite 241 
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T-theoretischen Variablen. Dazu muss die Theorie auch Annahmen iiber Zusam- 
menhange zwischen T-theoretischen und nicht-T-theoretischen Variablen enthalten. 

0 Im Experiment von Frey und Irle wird der kleinere Meinungsunterschied bei geringer 
Belohnung dadurch erklart, dass geringere Belohnung fur einstellungskontrares Verhalten 
zu starkerer Dissonanz fiihrt und diese nach der fundamentalen dissonanztheoretischen 
Gesetzesannahme mit einem groBeren Reduktionsdruck verbunden ist (vgl. oben 
Abbildung 11.3). Disstdrke und Reddruck sind dabei Diss-theoretische Begriffe und 
werden nicht direkt gemessen. 

T-theoretische Begriffe finden sich in alien etwas komplexeren psychologischen 
Theorien. Sie fehlen allenfalls in einfachen und empirienahen Hypothesen iiber 
Variablenzusammenhange. Aussagen ohne T-theoretische Begriffe konnen zwar 
Befunde zusammenfassend beschreiben, aber eben nicht auf einer allgemeineren und 
abstrakteren Ebene theoretisch erklaren. 

In der Psychologie konnen die Werte T-theoretischer Variablen meist nicht 
numerisch genau bestimmt werden. Moglich sind vielmehr nur Aussagen iiber die 
Rangordnung von Merkmalsauspragungen. Dies liegt daran, dass die theoretischen 
Annahmen jeweils lediglich einen monotonen Zusammenhang zwischen einer 
theoretischen und einer nicht-theoretischen Variablen spezifizieren. 

0 Dissonanzstarke und Reduktionsdruck sind nach den Axiomen 10 und 11 aus (11-6) 

568 

monoton mit Belohnungshohe und Meinungsunterschied verbunden. 

Bei physikalischen Theorien hingegen finden wir exaktere Gesetzesannahmen und 
damit auch genauer errechenbare T-theoretische GroBen . 569 

11.7.2 Partialmodelle 

Geht man von einem potenziellen Modell eines Theorie-Elements aus und eliminiert 
alle T-theoretischen Begriffe, erhalt man ein sog. partielles potenzielles Modell oder, 
kiirzer ausgedriickt, ein Partialmodell. Bei der Definition der Partialmodelle eines 
Theorie-Elements werden dementsprechend nur die nicht-theoretischen Begriffe 
eingefiihrt und charakterisiert. 

6 Beim Basiselement DissB umfasst das Partialmodell die Begriffe Zeitpunkte, 
Rohkognitionen, Kognitionen, Disskog, Konskog und paarwicht. Beim Bereichselement 
DissF beispielsweise kommen die speziell eingefiihrten Begriffe (. Meinkon , meinunt, 
wicht, belohn) hinzu, da diese nicht-Diss-theoretisch sind. 



56 V 

Ohne T-theoretische Begriffe beschrieben werden z.B. Verlaufe psychophysischer 
Funktionen, Lokalisationen von Fertigkeiten im Gehirn oder Risikofaktoren fur 
Erkrankungen, obwohl erklarende Theorien jeweils aussagekraftiger waren. 

568 Diss-theoretisch sind auch paardiss und paarkons (Westermann, 1987a, S. 72-75). 

569 Beispielsweise ist das Gewicht eines Korpers proportional zur Auslenkung einer 
Federwaage (Balzer et al., 1987, S. 68-72). 
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Die Menge aller Partialmodelle eines Theorie-Elements wird mit M pp bezeichnet. 
Diese Menge M pp gehort ebenso wie die Mengen M p und M der potenziellen und 
tatsachlichen Modelle zum Kern K der Theorie. 

Die Menge der Partialmodelle umfasst die moglichen Anwendungen, d.h. die 
moglichen empirischen Daten fur ein Theorie-Element: Um ein Theorie-Element auf 
einen bestimmten Realitatsausschnitt anwenden zu konnen, muss diese Situation als 
Partialmodell des Theorie-Elementes beschreibbar sein. Zu einer Anwendungs- 
situation gehoren bestimmte Beobachtungseinheiten, Behandlungen, Beobachtungen, 
situationale Umstande und Zeitpunkte. 570 

Durch ein Partialmodell werden Anwendungssituationen zwar ohne T- 
theoretische, aber mit den iibrigen Begriffen einer Theorie T beschrieben. Die Art 
der Beschreibung wird damit von der Theorie bestimmt. Es werden genau die 
Objekte, Merkmale und Relationen einbezogen, die fur die Theorie relevant sind. 
Partialmodelle sind (Re-)Konstruktionen der Realitat: Daten, die wir „durch die 
Brille der Theorie“ erblicken. 571 

0 Um das Basiselement der Dissonanztheorie auf eine bestimmte Person in einer 
bestimmten Situation anzuwenden, miissen wir zu mindestens einem Zeitpunkt 
Kognitionen, dissonante und konsonante Kognitionspaare identifizieren und die 
Wichtigkeit dieser Kognitionspaare bestimmen. Um das Bereichselement DissF 
anwenden zu konnen, miissen wir dariiber hinaus noch Informationen liber die 
Auspragungen von mindestens zwei der zusatzlichen bereichsspezifischen Variablen 
haben: einer unabhangigen, mit der Dissonanzstarke und einer abhangigen, mit dem 
Reduktionsdruck verbundenen Variablen (z.B. Wichtigkeit und Meinungsunterschied). 

Viele der nicht-T-theoretischen Variablen einer Theorie sind allerdings nicht direkt 
beobachtbar. Ihre Auspragungen konnen nur indirekt aus anderen Beobachtungen 
abgeleitet werden. Um diese Ableitungen oder Aufbereitungen zu begriinden, ziehen 
wir unser Alltagsverstandnis, vor allem aber fachwissenschaftliche Theorien, 
Methoden und Konventionen heran. Die Auspragung von abhangigen Variablen wird 
je nach Fragestellung z.B. durch systematische Beobachtungen, standardisierte 
Skalen oder Reaktionszeiten bestimmt. Um bestimmte Auspragungen einer unab- 
hangigen Variablen zu realisieren, versucht man meist gezielt, entsprechende 

579 

Situationen herzustellen und andere mogliche Einflussfaktoren zu kontrollieren. 

0 Bei der Anwendung der Dissonanztheorie werden abhangige Variablen wie Meinungen 
und Attraktivitaten durch die iiblichen Befragungs- und Skalierungsmethoden erfasst. 
Durch feste experimentelle Situationen und Ablaufe versucht man sicherzustellen, dass 
alle Personen eine bestimmte Kognition haben (z.B. wissen, dass sie gerade freiwillig 
einen Aufsatz gegen die Senkung des Wahlalters geschrieben haben). Die unabhangige 



570 abgekurzt: utosch fur units, treatments , observations , settings und chronos (Cook et al., 
1990, S. 495) 

571 Balzer (1982, S. 288-291; 1997, S. 134-145), Kuipers (1996, S. 93) 

572 Beispiele siehe oben Kapitel 1.3 
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Variable wird durch gezielte Gestaltung der experimentellen Situation hergestellt (z.B. 
wird der einen Halfte der Personen 1 DM versprochen, der anderen Halfte 8 DM). 

11.7.2.1 Erganzung von Partialmodellen zu tatsachlichen Modellen 

1st eine Situation als Partialmodell eines Theorie-Elements beschrieben, kann unter- 
sucht werden, ob es auch ein tatsachliches Modell ist. Dazu muss gepruft werden, ob 
das Partialmodell so um theoretische Begriffe erganzt werden kann, dass ein tatsach- 
liches Modell entsteht. Dazu mtissen die Daten hinreichend genau mit den substan- 
ziellen Axiomen ubereinstimmen. Ob dies der Fall ist, wird in der Psychologie an 
Hand von statistischen Signifikanztests entschieden (siehe unten Kapitel 15). 573 

0 Beim Experiment von Frey und Irle gehoren zum Partialmodell vor allem die selbst- 
werttangierenden Kognitionen liber das einstellungskontrare Aufsatzschreiben, die 
Belohnungen von 1 bzw. 8 DM und die Unterschiede zwischen der tatsachlichen und der 
vertretenen Meinung. Hinzugefugt werden mtissen die theoretischen Variablen 
Dissonanzstarke und Reduktionsdruck, und zwar gemaB der Axiome 6 und 7 des Theorie- 
Elements DissFI72 (siehe Abbildung 11.3): starkere Dissonanz bei 1 DM als bei 8 DM 
Belohnung und groBerer Reduktionsdruck bei kleinerem Meinungsunterschied. 
AuBerdem muss das Fundamentalgesetz der Theorie (Axiom 13 des Basiselements 
DissB) erfiillt sein: groBerer Reduktionsdruck bei starkerer Dissonanz. Diese 

Zuordnungen sind dann konsistent moglich, wenn die mit 1 DM belohnten Personen 
tatsachlich einen signifikant und wesentlich kleineren Meinungsunterschied zeigen als die 
mit 8 DM belohnten. Bei einem entgegengesetzten empirischen Ergebnis lasst sich die 
Situation nicht als Modell der Dissonanztheorie darstellen. 

Auch die Anwendung einer psychologischen Theorie in einer nattirlichen Situation 
entspricht dem Versuch, Partialmodelle zu potenziellen Modellen zu erganzen. 
Unterschiedliche Theorien und Sichtweisen fiihren dabei zu unterschiedlichen Such- 
richtungen und Deskriptionen. 

0 Beschreibt und analysiert man ein storendes Verhalten bei einer Person (z.B. einen 
Waschzwang) vom Standpunkt der operanten Verhaltenstheorien aus, werden bei einer 

sog. Verhaltensanalyse die vorangehenden, begleitenden und nachfolgenden Situationen, 

574 

Ereignisse und Verhaltensweisen der Person und ihrer Umwelt systematisch erfasst. 
Dies entspricht dem Versuch, ein Partialmodell eines Elementes der operanten 
Verhaltenstheorie zu identifizieren. 575 AnschlieBend kann man mogliche Verstarker fur 
das storende Verhalten und mogliche diskriminative Hinweisreize identifizieren. Das 
Partialmodell wird dadurch zu einem potenziellen Modell erganzt. Wird (wahrend einer 
therapeutischen Intervention) empirisch gezeigt, dass diese Reize und Verstarker 



573 



574 

575 



Die Bereiche, in denen Axiome noch approximativ gelten sollen, in die Beschreibung 
des Theorie-Elements aufzunehmen (Balzer, 1997; Moulines, 1996), ist deshalb fur uns 
nicht sinnvoll. 

Schulte (1976), Hautzinger (1996) 

Kraiker (1977, 1980) 
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tatsachlich das storende Verhalten aufrechterhalten, liegt ein tatsachliches Modell der 
operanten Verhaltenstheorie vor. 

0 Wird der gleiche Fall von anders ausgerichteten Personen beschrieben und analysiert, 
wird die Aufmerksamkeit von vornherein auf andere Sachverhalte gelenkt. Ein Psycho- 
analytiker erhebt Informationen liber fruhkindliche Entwicklungen und Ereignisse, ein 

kognitiver Verhaltenstherapeut fahndet nach fehlerhaften Einschatzungen und 

5 V6 

Einstellungen, ein Mediziner nach Gehirnerkrankungen und -verletzungen. Auf Grund 
der unterschiedlichen theoretischen Hintergrlinde kommen sie bei der Beschreibung des 
gleichen Falls zu unterschiedlichen Partialmodellen und damit auch zu unterschiedlichen 
Modellen und theoretischen Erklarungen. 




Abbildung 11.5 : Der Geltungsbereich und die potenziellen, tatsachlichen und 

S77 

partiellen potenziellen Modelle eines Theorie-Elements 

Die Mengen der potenziellen, tatsachlichen und partiellen potenziellen Modelle eines 
Theorie-Elements sind in der Abbildung 11.5 veranschaulicht. Dort ist eine obere, 
theoretische und eine untere, nicht-theoretische Ebene dargestellt. Auf der oberen 
Ebene ist die Menge M der tatsachlichen Modelle des Theorie-Elements 
symbolisiert. Sie ist stets eine Untermenge der Menge M p der potenziellen Modelle. 
Auf der unteren Ebene haben wir die Menge M pp der Partialmodelle. Die Doppel- 
pfeile symbolisieren sowohl die Reduktion der potenziellen Modelle auf die Partial- 
modelle als auch die Erganzung der Partialmodelle zu potenziellen und eventuell 
tatsachlichen Modellen. Die symbolisierten partiellen potenziellen Modelle x und y 



Davison & Neale (1996, S. 167-169) 

im AnschluB an Diederich (1981, S. 13) und Balzer (1982, S. 50) 
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konnen jeweils zu einem potenziellen Modell erganzt werden. Die Erganzung von y 
ist dabei ein tatsachliches Modell, die Erganzung von x dagegen nicht. 

11.7.2.2 Erkenntnistheoretische Konsequenzen 

Die Vorstellung des logischen Empirismus, dass die Wissenschaften auf einer 
sicheren Basis von personen- und theorieunabhangigen Beobachtungen aufbauen 
konnen, hat sich als nicht haltbar erweisen. Deshalb betonen wir aus struktura- 
listischer Sicht von vornherein, dass die empirische Basis einer wissenschaftlichen 
Theorie stets aus Strukturen besteht, die von dieser Theorie mitbestimmt werden. 

Die erkenntnistheoretische Position des Strukturalismus ist deshalb stark 
pragmatisch und konstruktivistisch gepragt: Die „Wirklichkeit“ ist nicht etwas 
Eindeutiges und Vorhandenes, das es zu entdecken gilt, vielmehr konstruieren wir 
uns ein Bild oder ein Modell von der Wirklichkeit, indem wir den interessierenden 
Phanomenbereich „durch die Brille der Theorie“ betrachten. 

Alle Systeme, die nicht als Partialmodelle der Theorie aufgefasst werden konnen, 
die also nicht durch die Brille der Theorie betrachtet werden konnen, miissen fur 
diese Theorie auBerhalb des Interesses bleiben. Mit Theorien ist aus struktura- 
listischer Sicht also kein universeller Anwendungsanspruch verbunden. Jede Theorie 
hat vielmehr nur einen bestimmten Bereich moglicher Anwendungen. 

Grundsatzlich konnen durch die Brille einer Theorie nicht alle Aspekte der 
vorgefundenen oder hergestellten Systeme betrachtet und erkannt werden. Gerade 
psychologisch interessante Phanomene werden stets von einer Vielzahl von Faktoren 
beeinflusst, von denen in einer Theorie stets nur ganz wenige berlicksichtigt werden. 
Deshalb konnen parallel zueinander verschiedene Theorien benutzt werden, um 
unterschiedliche Aspekte eines Phanomenbereiches oder komplexen Sachverhaltes 
zu beschreiben und zu erklaren. Bei der empirischen Priifung einer dieser Theorien 
miissen jeweils die Einfllisse der anderen Faktoren ausgeschaltet oder konstant 
gehalten werden. Dazu werden in den empirischen Wissenschaften Experimente oder 
andere kontrollierte Untersuchungstechniken eingesetzt (siehe Kapitel 12). 

0 Die von der Dissonanztheorie betrachteten Meinungsunterschiede nach einstellungs- 
kontrarem Verhalten konnen nicht nur von den theoretisch beriicksichtigten Variablen 
(Belohnung und Wichtigkeit bzw. Dissonanzstarke und Reduktionsdruck) beeinflusst 
werden, sondern beispielsweise auch von vorangegangenen Erfahmngen (vor allem in 
ahnlichen Situationen), von Erwartungen und Vermutungen (z.B. liber das beste Ver- 
halten), von Personlichkeitseigenschaften (z.B. Anschlussbediirfnis). Um diese weiteren 
Einfliisse konstant zu halten, wird die Dissonanztheorie nicht am Verhalten einzelner 
Personen in ihrem Alltag iiberpriift, sondern man betrachtet Personengruppen in 
kontrollierten Experimentalsituationen. 
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Theoriegetranktheit 

Besonders von Popper wurde betont, dass alle Beobachtungen theoriegetrankt oder 
theoriegeladen sind (siehe Kapitel 9.1.3). Auf der Basis des strukturalistischen 
Theoretizitatskriteriums konnen wir drei verschiedene Aspekte dieser Theorie- 

C70 

getranktheit unterscheiden. 

Erstens sind die T-theoretischen Begriffe theoriegetrankt in einem starken Sinn: 
Ihre Auspragungen lassen sich nicht unabhangig von der Gliltigkeit der Theorie T 
ermitteln. 

Zweitens konnen die fur eine Theorie T nicht-theoretischen Begriffe in der Regel 
nur auf der Basis anderer Theorien erfasst werden und sind deshalb (in einem 
schwacheren Sinn) ebenfalls theoriegetrankt. 

Drittens sind Beobachtungen in dem Sinne theoriegetrankt, dass die vom Forscher 
zugrunde gelegte Theorie bestimmt, welche empirischen Systeme Partialmodelle der 
Theorie sein konnen, welche Aspekte der Realitat also „durch die Brille der Theorie“ 
betrachtet werden konnen. 

11.7.2.3 Theoretische Erklarung 

In den beschriebenen Beispielen wird die wichtige Funktion von T-theoretischen 
Begriffen in der Wissenschaft deutlich: Sie dienen dazu, verschiedene empirische 
Zusammenhange einheitlich zu erklaren. Der Begriff der Erklarung erhalt dabei 
durch die strukturalistische Wissenschaftstheorie eine neue Bedeutung: Die Theorie 
erklart empirische Phanomene, wenn diese Sachverhalte Modelle der Theorie sind. 579 

0 Im Falle der Dissonanztheorie werden durch den Zusammenhang zwischen den Diss- 
theoretischen Begriffen Dissonanzstarke und Reduktionsdruck Zusammenhange zwischen 
verschiedenen empirischen Variablen einheitlich erklart: der Zusammenhang zwischen 
der Belohnungshohe und den Meinungsunterschieden, zwischen der Wichtigkeit der 
Entscheidung und den Attraktivitatsunterschieden, zwischen der Attraktivitat des 
Kommunikators und der Meinungsangleichung usw. 

Gegeniiber der klassischen deduktiv-nomologischen Erklarung und ihren Varianten 
und Abschwachungen (siehe oben Kapitel 8) hat dieses pragmatische Erklarungs- 

con 

konzept des Strukturalismus wesentliche Vorteile. Erstens setzt es nicht voraus, 
dass die Beschreibung eines zu erklarenden Sachverhalts tatsachlich logisch aus 
Gesetzesannahmen und Randbedingungen folgt. Zweitens bezieht es sich auf die 
Erklarung von ganzen Klassen von empirischen Phanomenen und nicht nur von 
einzelnen Sachverhalten. Drittens wird das zu Erklarende nicht nur unter einzelne 
Gesetze subsumiert, sondern unter ganze Theorien oder Theorie-Netze mit all ihren 



J 0 Stegmuller (1980, S. 51, 152) 

579 Praziser gesagt miissen sich diese empirischen Phanomene als Partialmodell eines 
Theorie-Elements bechreiben lassen, das sich zu einem Modell erganzen lasst. 

580 Balzer (1997, S. 320-327), Bartelborth (1996, 1999), van Fraassen (1988) 





Struktur wissenschaftlicher Theorien 



251 



inter- und intratheoretischen Verbindungen. Das zu Erklarende wird in einen 
umfassenden theoretischen Kontext eingebettet, der unterschiedlich differenzierte 
Vorstellungen liber das Zustandekommen der interessierenden Sachverhalte enthalt. 
Eine derartige theoretische Einbettung bringt uns einem wichtigen Ziel jeder 
Wissenschaft naher: die Phanomene zu verstehen. 5U 

11.7.3 Geltungsbereich und Gehalt eines Theorie-Elements 

• Die Menge derjenigen Partialmodelle eines Theorie-Elements T, die zu 
tatsachlichen Modellen erganzt werden konnen, wird als Geltungsbereich von T 
bezeichnet und mit G(T) abgektirzt (vgl. Abbildung 11. 5). 582 

Besitzt eine Theorie keine T-theoretischen Begriffe, ist der Geltungsbereich G(T) 
gleich der Menge M(T) der Modelle von T. 

• Ein Theorie-Element ist empirisch gehaltvoll, wenn empirische Situationen 
denkbar sind, die zwar als Partialmodelle des Theorie-Elements beschreibbar sind, 
nicht aber als tatsachliche Modelle. 

Dies ist dann der Fall, wenn es Daten geben kann, die dem Theorie-Element 
widersprechen oder, anders ausgedriickt, wenn in einem Modell des Theorie- 

coo 

Elementes T bestimmte empirische Ergebniskonstellationen nicht auftreten dlirfen. 

Ist ein Theorie-Element T empirisch gehaltvoll, ist G(T) eine echte Untermenge 
von Mpp(T) und M(T) ist eine echte Untermenge von M p (T). Ein empirisch 
gehaltvolles Theorie-Element ist, grob gesprochen, falsifizierbar im Sinne von 
Popper. 

0 Ein Partialmodell des Theorie-Elements DissFI72 ist, wie wir gerade gesehen haben, 
nicht zu einem tatsachlichen Modell zu erganzen, wenn in der Experimentalbedingung 
mit geringerer Belohnung ein groBerer Meinungsunterschied auftritt als in der Bedingung 
mit hoherer Belohnung. Dieses Theorie-Element ist also empirisch gehaltvoll. 

• Ein Theorie-Element T wird als empirisch gehaltlos bezeichnet, wenn alle Partial- 
modelle zu tatsachlichen Modellen erganzt werden konnen. 

In diesem Fall sind keine Beobachtungen denkbar, die den Annahmen des Theorie- 
Elements widersprechen. Es gibt also keine Situationen, in denen zwar die 



581 

Friedman (1988), vgl. Schurz (1988b) zu einer formalisierten Theorie des Verstehens 

582 Im Strukturalismus wird G(T) als der empirische Gehalt des Theorie-Elements T 
bezeichnet (Balzer et al., 1987, S. 82-85; Westermann, 1987a, S. 82-85). Diese 
Bezeichnung fiihrt jedoch leicht zu Verwechselungen mit dem bekannten Konzept des 
empirischen Gehalts einer Theorie im Sinne von Popper (siehe oben Kapitel 10.2.2). 

583 Da wissenschaftliche Theorien (implizit) probabilistisch interpretiert und mit Ceteris- 
paribus-Annahmen versehen werden (siehe Kapitel 7.2.4), sind Signifikanztests oder 
andere Entscheidungskriterien notwendig, um zu beurteilen, ob empirische Ergebnisse 
mit einem Theorie-Element vereinbar sind. 
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terminologischen Axiome erfullt sind, nicht aber die substanziellen. Der 
Geltungsbereich G(T) ist in diesem Fall gleich der Menge M pp (T) der Partialmodelle, 
und die Menge M p (T) der potenziellen Modelle ist gleich der Menge M der 
tatsachlichen Modelle. Empirisch gehaltlose Theorie-Elemente sind in Poppers Sinn 
nicht falsifizierbar. 

In Wissenschaften, die sich als empirisch verstehen, wird unterstellt, dass alle 
Theorien und Hypothesen empirisch gehaltvoll sind, also synthetische Aussagen 
darstellen. Insbesondere Jan Smedslund hat jedoch demonstriert, dass bekannte 
psychologische Aussagen offenbar analytisch sind, also notwendigerweise wahr und 
damit empirisch nicht gehaltvoll. 584 Dies bedeutet aber nicht, dass psychologische 
Theorien insgesamt empirisch gehaltlos sind und dass empirische Priifungen dieser 
Theorien iiberflussig sind. Zwar ist das Basiselement in der Regel empirisch 
gehaltlos. Die differenzierteren Elemente des Theorie-Netzes hingegen haben meist 
durchaus empirischen Gehalt. 

0 Empirisch gehaltlos ist das Basiselement DissB der Dissonanztheorie. Liegt ein Partial- 
modell vor, d.h. haben wir Informationen iiber dissonante und konsonante Kognitions- 
paare und deren Wichtigkeit, konnen wir daraus mit Hilfe der substanziellen Axiome aus 
(11-2) Aussagen iiber Dissonanzstarke und Reduktionsdruck ableiten. Diese Aussagen 
konnen aber mit keinen moglichen Beobachtungen in Konflikt stehen, weil im 
dissonanztheoretischen Basiselement noch keine Annahmen dariiber enthalten sind, wie 
sich ein moglicher Reduktionsdruck in beobachtbarer Weise manifestiert. Wie wir 
exemplarisch fur DissFI72 gesehen haben (siehe oben Kapitel 11.4.3), gibt es 
differenziertere Elemente im Theorie-Netze, die gehaltvoll sind, so dass ihnen empirische 
Ergebnisse entgegenstehen konnen. 

0 Auch in der Rubikontheorie ist das Basiselement empirisch gehaltlos, wahrend die 
Bereichselemente empirischen Gehalt haben. 585 
0 In der ACT*-Theorie sind neben dem Basiselement auch die Bereichselemente noch 
gehaltlos, erst noch differenziertere Theorieformen haben empirischen Gehalt. 586 

In etlichen empirischen Forschungsarbeiten werden konkrete Hypothesen untersucht, 
die empirisch gehaltlos sind, weil die angenommenen Zusammenhange schon aus 
der Bedeutung der verwendeten Begriffe folgen. Sie bedurfen deshalb keiner em- 
pirischen Priifung. Beobachtete Abweichungen konnen vielmehr nur inkonsistente 
Begriffsverwendungen darstellen. 

0 Nach einer empirischen Untersuchung von Feather wurde von Personen „am attraktivsten 

... Erfolg bei einer schwierigen Aufgabe bewertet, ... am unangenehmsten Misserfolg bei 

587 

einfachen Aufgaben.“ Wurde man die Personen bitten, die Bedeutung des Begriffes 



Smedslund (1979, 1984, 1994), Brandtstadter (1982, 1984), Gergen (1986a), Kukla 
(1989), Wallach & Wallach (1994, 1998), Kritik: Reisenzein (1984), Mees (1984) 
Gerjets (1995, S. 143-145) 

Heise (1991, 1993), siehe auch Wexler (1978) und Anderson (1980) 

Weiner (1988, S. 284) 
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der „Attraktivitat“ (eines Erfolges) und der „Unangenehmheit“ (eines Misserfolgs) zu 
erlautern, wtirden sie sinngemaB wahrscheinlich wie folgt antworten: „Attraktiv“ ist ein 
Erfolg, wenn ich ihn bei einer schwierigen Aufgabe habe, „unangenehm“ ist ein 
Misserfolg, wenn mir eine einfache Aufgabe misslingt. Aus dieser Explikation der 
Begriffe folgt also bereits das, was als empirischer Befund dargestellt wurde. 



11.8 Intendierte Anwendungen 

Wenn in den vorangegangenen Kapiteln 11.3 bis 11.7 die einzelnen Elemente eines 
theoretischen Netzes analysiert und beschrieben wurden, haben wir primar die 
verschiedenen Bestandteile betrachtet, aus denen der abstrakte Kern eines Theorie- 
Elements besteht: die potenziellen Modelle, die tatsachlichen Modelle, die Bander zu 
anderen Elementen und die partiellen potenziellen Modelle. 

Aus den bisherigen Beschreibungen von Theorie-Elementen diirfte bereits 
deutlich geworden sein, dass ein formaler oder abstrakter Kern allein noch keine 
empirische Theorie darstellt. Theorien einer empirischen Wissenschaft mtissen sich 
von Theorien einer formalen Wissenschaft dadurch unterscheiden, dass sie Aussagen 
liber die „Realitat“ auBerhalb der Theorie erlauben. Zu einer empirischen Theorie 
gehort neben den Begriffen und Annahmen deshalb immer auch eine Spezifikation 
der Situationen, fur die diese Theorie giiltig sein soil. 

0 Die Bereichselemente der Dissonanztheorie unterscheiden sich nicht nur in ihren 
Begriffen und Zusammenhangsannahmen, sondern auch darin, dass sie auf 

unterschiedliche Situationen angewendet werden sollen: auf Personen, die 

Entscheidungen getroffen haben, die zu einem einstellungskontraren Verhalten genotigt 
worden sind, die Informationen suchen oder die sozialen Beeinflussungsprozessen 
ausgesetzt sind. 

• Jedes Element T eines Theorie-Netzes besteht deshalb aus zwei Komponenten: 
dem Kern K und der Menge I der intendierten Anwendungen: T = (K,I). 

Die Verbindungen zwischen Theoriekern und Theorieanwendungen werden im 
Kapitel 11.8.1 betrachtet. Die intendierte Anwendungsmenge ist stets offen und nur 
unscharf abzugrenzen (Kapitel 11.8.2). Zu ihr gehoren nicht nur die bekannten 
erfolgreichen Anwendungen, sondern auch die vermuteten und die zweifelhaften 
Anwendungen. Von verschiedenen Personen und zu unterschiedlichen Zeiten kann 
die Giiltigkeit der Theorie fur unterschiedliche Anwendungssituationen angenommen 
werden, die Vertreter einer Theorie konnen also unterschiedliche empirische 
Behauptungen mit ihr verbinden (Kapitel 1 1.8.3). 

11.8.1 Intendierte Anwendungen und empirische Behauptungen 

Theoriekern und Theorieanwendungen eines Theorie-Elements sind auf zweierlei 
Weise miteinander verbunden. Zum einen ist die Menge I der intendierten 
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Anwendungen eine Untermenge der Menge M pp der moglichen Anwendungen. Zum 
anderen sind mit jedem Theorie-Element T eine empirische Behauptung und 
zahlreiche empirische Hypothesen verbunden. Diese Zusammenhange werden im 
folgenden naher erlautert und sind in der Abbildung 1 1.6 skizziert. 

Wie wir im Kapitel 11.7.2 gesehen haben, ist ein partielles potenzielles Modell 
eines Theorie-Elementes eine Struktur, die eine mogliche Anwendung dieses 
Elementes darstellt. Jedes Partialmodell entspricht einem Realitatsausschnitt, der in 
der nicht-theoriespezifischen Begrifflichkeit dieses Theorie-Elementes beschrieben 
wird. Es kann aber durchaus Systeme geben, die rein formal zwar durch die Brille 
der Theorie betrachtet werden konnen, die also als Partialmodelle der Theorie 
beschrieben werden konnen, auf die die Theorie aber nicht angewendet werden soil. 




Abbildung 11.6 : Zusammenhange zwischen Theoriekern und Theorieanwendungen 

0 Ein Hundeziichter beobachtet, dass seine Tiere stark davor zuriickscheuen, einen Fluss zu 
durchqueren. Er treibt jeden Hund dazu, einmal durch das Wasser zu laufen und gibt 
ihnen anschlieBend eine groBes oder ein kleines Stuck Fleisch. AnschlieBend beobachtet 
er, wie sehr sich ihre Scheu vor dem Wasser verringert hat. 

Diese Situation kann als Partialmodell eines Theorie-Elementes fur Forced- 
compliance-Dissonanz beschrieben werden. Wenn wir unterstellen, dass die Hunde 
„Kognitionen“ haben und die Scheu vor dem Wasser als „negative Meinung“ 
beschreiben, ist das aufgenotigte Durchqueren des Wassers ein „einstellungskontrares 
Verhalten“. Zeigen die Hunde anschlieBend eine groBere Bereitschaft, das Wasser zu 
durchqueren, ist dies als Anpassung der Meinung an das Verhalten oder als Verringerung 
des Meinungsunterschieds zu beschreiben. 

Allerdings kann man der Auffassung sein, dass die Dissonanztheorie fur Hunde gar 
nicht gelten soil, beispielsweise weil man es nicht fur sinnvoll halt, anzunehmen, dass 
Tiere Kognitionen und Meinungen haben. In diesem Fall ware die Hundesituation zwar 
eine mogliche, aber keine intendierte Anwendung. 

Die Menge der Anwendungen eines Theorie-Elements, die von einem Wissen- 
schaftler oder einer Wissenschaftlergruppe zu einer bestimmten Zeit tatsachlich als 
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intendierte Anwendungen betrachtet werden, ist entweder gleich der Menge der 

coo 

Partialmodelle oder eine Untermenge. Fur alle Theorie-Elemente gilt also I c M pp . 

Ein Partialmodell ist genau dann eine erfolgreiche Anwendung eines Theorie- 
Elements, wenn es zu einem tatsachlichen Modell erganzt werden kann, das heiBt, 
wenn die T-theoretischen Begriffe so hinzugefligt werden konnen, dass alle 
substanziellen Axiome des Theorie-Elements (zumindest approximativ) erfullt sind. 
Die Menge der Partialmodelle, die auf diese Weise zu Modellen erganzt werden 
konnen, ist der Geltungsbereich G des Theorie-Elements (siehe Kapitel 11.7.3). 

• Mit jedem Theorie-Element ist zu jedem Zeitpunkt die empirische Behauptung I 
tz G verbunden: die vorlaufige und revidierbare Annahme, dass alle momentan 
intendierten Anwendungen auch erfolgreiche Anwendungen sind. 589 

Eine empirische Behauptung ist eine Rekonstruktion dessen, was wir als 
psychologische oder (allgemeiner) wissenschaftliche Hypothese bezeichnet haben. 

Fasst man die empirischen Behauptungen fiir alle Elemente eines Theorie-Netzes 
zusammen, erhalt man die empirische Behauptung, die mit dem gesamten Netz 
verbunden ist. Sie driickt das aus, was zu einer bestimmten Zeit mit Hilfe der 
Theorie uber die Realitat ausgesagt wird. 

11.8.2 Zusammensetzung der intendierten Anwendungsmenge 

Die Menge I der intendierten Anwendungen eines Theorie-Elementes ist ein 
pragmatisches Konzept, mit dessen Hilfe der tatsachliche Umgang mit Theorien und 
ihren Anwendungen zu rekonstruieren ist. Nach dem bisher Gesagten ist die Menge I 
grundsatzlich offen, sie umfasst unendlich viele Elemente, und sie kann nur unscharf 
abgegrenzt werden. 

Die Offenheit der Menge der intendierten Anwendungen entsteht dadurch, dass 
zum einen neue erfolgreiche Anwendungen hinzukommen und dass zum anderen 
vorlaufig aufgenommene Anwendungen nach theorie- und erwartungswidrigen 
empirischen Ergebnissen wieder eliminiert werden. 



Sneed (1979, S. 181-182), Balzer, Moulines & Sneed (1987, S. 88). Bei genauerer 
Betrachtung hat es Vorteile, I als Untermenge der Potenzmenge von M pp zu charakteri- 
sieren. Die Menge von intendierten Anwendungen besteht dann aus mehreren Klassen 
von Anwendungsmoglichkeiten, innerhalb derer die Partialmodelle einander relativ 
ahnlich sind, wahrend zwischen diesen Klassen eine recht groBe Heterogenitat bestehen 
kann. Die Zahl dieser Anwendungsfalle innerhalb einer Klasse kann sehr groB und 
unbekannt sein. Die verschiedenen Klassen hingegen sind in der Regel wohlbekannt. 

589 Falls es keine T-theoretischen Begriffe gibt, lautet die empirische Behauptung IcM. 
Bei genauer Formulierung von empirischen Behauptungen sind auch die 
Querverbindungen (Eindeutigkeitsbedingungen, constraints ) mit einzubeziehen (Balzer 
et al., 1987, S. 89-92; Westermann, 1987a, S. 81-82). 
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Jede Anwendungsmenge muss unendlich viele Elemente umfassen, weil eine 

Theorie nicht nur endlich viele Beobachtungen zusammenfassen soil, sondern auch 

Aussagen liber nicht untersuchte oder zuklinftige Falle erlauben muss. 

Eine genaue extensionale oder intensionale Definition der Menge I lasst sich aus 

verschiedenen Griinden nicht geben. In der Zusammensetzung der intendierten 

• • 

Anwendungsmenge spiegeln sich zum einen die Ansichten, Uberzeugungen und 
Gewohnheiten der Wissenschaftler wider, die haufig gar nicht explizit gemacht 
werden konnen und sich auch liber die Zeit und zwischen den Personen betrachtlich 
unterscheiden konnen. Die unendlich vielen moglichen Anwendungen einer Theorie 
konnen sich zum anderen in einer Vielzahl von Merkmalen unterscheiden. Kein 
Anwender einer Theorie kann von vornherein prazise definieren, welche Merkmale 
einzeln notwendig und zusammen hinreichend daflir sind, dass eine sinnvolle 
Anwendung der Theorie vorliegt. 





Abbildung 11.7: Veranschaulichung der Menge der intendierten Anwendungen 

Die Zusammensetzung der intendierten Anwendungsmenge I lasst sich also nur grob 
umschreiben. 590 Einige Anwendungen und Partialmodelle gehoren auf jeden Fall 
dazu: die paradigmatischen und die spateren erfolgreichen Anwendungen. 

AuBerdem gehoren zu den intendierten Anwendungen alle moglichen Anwendungen, 



590 Um die Abgrenzung genauer gestalten zu konnen, miissten vor allem prazisere MaBe fur 
die Ahnlichkeit zwischen den vermuteten und den bisherigen erfolgreichen Anwen- 
dungen definiert und erhoben werden (siehe die Uberlegungen zur Berechtigung 
empirischer Vermutungen im Kapitel 4.3). Dies setzt voraus, dass man die Merkmale 
benennen kann, die die Ergebnisse im betrachteten Anwendungsbereich beeinflussen. 
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die ihnen sehr ahnlich sind ( vermutete Anwendungen). Vorlaufig zur Menge I 
gezahlt werden schlieBlich alle Anwendungen, bei denen noch empirisch gepriift 
werden muss, ob sie erfolgreiche Anwendungen sind ( zweifelhafte Anwendungen). 
Diese vier Teilmengen der intendierten Anwendungen werden in der Abbildung 11.7 
veranschaulicht und im folgenden naher beschrieben. 591 

(1) Paradigmatische Anwendungen 

Wenn eine neue Theorie der Fachoffentlichkeit vorgestellt wird, legen ihre Vertreter 
meist auch gleich eine oder mehrere empirische Untersuchungen mit theorie- 
konformen Ergebnissen vor. Sie werden als paradigmatische Anwendungen 
bezeichnet und in der Untermenge I 0 von I zusammengefasst. 592 Sie entsprechen in 
etwa dem, was Thomas Kuhn als paradigmatische Beispiele ( exemplars ) bezeichnet 
hat. 593 Wahrend der Arbeit mit der Theorie wird in der Regel nicht in Zweifel 
gezogen, dass die paradigmatischen Anwendungen tatsachlich erfolgreiche Anwen- 
dungen sind. Es wird also angenommen, dass die Untermenge I 0 von I auch eine 
Untermenge des Geltungsbereichs G ist: I 0 c G (vgl. Abbildung 11.7). Dieser Teil 
der empirischen Behauptung wird also durchgangig als zutreffend akzeptiert. 

Auf den weiteren Umgang mit dieser Theorie haben die paradigmatischen 
Anwendungen einen sehr pragenden Einfluss. Die nachfolgenden empirischen 
Untersuchungen und Priifungen der Theorie finden haufig unter relativ ahnlichen 
Bedingungen statt. Vor allem die Operationalisierungen der betrachteten Variablen 
entsprechen oft sehr genau den paradigmatischen Anwendungen. In Lehrbiichern 
werden die paradigmatischen Anwendungen haufig herangezogen, um die Theorie 
anschaulich darzustellen und zu zeigen, dass sie sich empirisch bewahrt hat. 

0 Festinger hat schon in seiner ersten Darstellung der Dissonanztheorie fur jeden der vier 
Anwendungsbereiche Untersuchungen angefuhrt, die er als erfolgreiche Anwendungen 
seiner Theorie interpretiert. 594 Etliche von ihnen sind tatsachlich in dem Sinne paradig- 
matisch geworden, als sie die nachfolgende dissonanztheoretische Forschung sehr stark 
gepragt haben: 

- das Experiment von Brehm zur Veranderung der Attraktivitat von gewahlten und nicht 
gewahlten Konsumartikeln, 

- die Experimente von Janis und King zur Meinungsangleichung nach einer einstel- 
lungskontraren offentlichen Rede, 

- Festingers Experiment zur Aufnahme von Information nach einer Entscheidung und 

- verschiedene Experimente zur Meinungsanderungen und Beeinflussungsversuchen in 
Gruppensituationen. 



Westermann, Heise & Gerjets (1992) 

Sneed (1979, S. 267-286), Balzer, Moulines & Sneed (1987, S. 38-39) 
Kuhn (1977b, 1981), siehe oben Seite 199 
Festinger (1978) 
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0 Als Belege fur die empirische Fundierung der Rubikontheorie der Handlungsphasen 
schildern Heckhausen und Gollwitzer insgesamt 14 eigene Experimente, von denen sich 
fiinf auf die vier Handlungsphasen und die restlichen auf die abwagenden und die 
planenden Bewusstseinslagen beziehen. 595 

0 Die wichtigste paradigmatische Anwendung der ACT*-Theorie ist im Teilbereich des 

Faktenabrufs das Experiment von Reder und Ross zum Wiedererkennen von einfachen 

596 

Satzen. Es wird von Anderson selbst als Anwendungsbeispiel fur seine Theorie 
genannt und bezieht erstmals auch ACT*-spezifische Gesetze in die empirische Prtifung 
mit ein. Fur den Teilbereich des Fertigkeitserwerbs kommt vor allem ein Experiment von 

McKendree und Anderson zum Erlernen des Programmierens in LISP als para- 

597 

digmatische Anwendung in Frage. 

0 Im Falle von Skinners operanter Verhaltenstheorie stellen die klassischen Tier-experi- 
mente in der Skinner-Box die ersten paradigmatischen Anwendungen der Theorie dar. In 
ihnen konnte gezeigt werden, dass operantes Verhalten durch seine Konsequenzen 
zuverlassig gesteuert werden kann. Spatere Anwendungen der Theorie bezogen sich auf 
unterschiedliche Organismen, Verhaltensweisen, Stimuli, Verstarkungsplane usf. 598 

Zu den paradigmatischen Anwendungen der Theorie durch ihre ersten Vertreter 
gehoren oft auch Anwendungen auf bekannte und durch andere Theorien gut erklarte 
Phanomene. In der Regel wird eine neue Theorie nur dann bemerkt und akzeptiert, 
wenn sie auch bekannte Sachverhalte aus dem angezielten Anwendungsbereich gut 
beschreiben und erklaren kann. Dies ist am besten dann moglich, wenn die neue 
Theorie Konzepte und Annahmen vorliegender Theorien integriert. 

0 Anderson zeigt bei der Presentation seiner ACT*-Theorie, dass sie vorliegende Befunde 
zur unterschiedlichen Kodierung geometrischer und verbaler Informationen und zur 
mentalen Rotation erklaren kann. 599 

(2) Erfolgreiche Anwendungen 

Falls eine Theorie nicht vollig unbeachtet bleibt, werden nach den paradigmatischen 
Anwendungen noch weitere Untersuchungen durchgeftihrt. Sie konnen zum einen 
dazu dienen, die Theorie unter anderen, eventuell strengeren Bedingungen zu 
iiberprufen. Das Ziel kann auch darin bestehen, eine interessierende inhaltliche 
Fragestellung mit Hilfe dieser Theorie zu analysieren. 

Jede nicht-paradigmatische Anwendung mit theorie- und vorhersagekonformen 
Ergebnissen gehort zur Menge I e der (nachfolgenden) erfolgreichen Anwendungen. 
Diese ist ebenfalls eine Untermenge des Geltungsbereichs des Theorie-Elements: I e 
c G (siehe Abbildung 1 1.7). 



595 

596 

597 

598 

599 



Heckhausen (1989), Gollwitzer (1991), Gerjets (1995, S. 128-141) 
Reder & Ross (1983), Heise (1991, S. 97-114) 

McKendree & Anderson (1987), Heise (1991, S. 151-165) 

Bower & Hilgard (1983, S. 247-307), Kraiker (1980, S. 223-224) 
Anderson (1983) 
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0 Zu den nachfolgenden erfolgreichen Anwendungen der Dissonanztheorie gehort das 
bereits mehrfach angesprochene Experiment mit den einstellungskontraren Aufsatzen zur 
Senkung des Wahlalters von Frey und Irle. Es weist deutliche Ahnlichkeiten zu den 
paradigmatischen Experimenten zur Dissonanz nach einstellungskontrarem Verhalten 
auf. Es ist zum einen eine erfolgreiche Anwendung des speziellen Theorie-Elements 
DissFI72, das die spezifischen theoretischen Annahmen reprasentiert, die dem Experi- 
ment zugrunde liegen. Zum anderen gehort es zu den erfolgreichen Anwendungen aller 
iibergeordneten Theorie-Elemente: des Bereichselements DissF, seiner selbstkonzept- 
bezogenen Modifikation DissF.S, der bereichstibergreifenden Modifikation DissB.S und 
des Basiselements DissB. 

(3) Vermutete Anwendungen 

Die intendierten Anwendungsmengen von empirischen Theorien sind nicht auf die 
bereits bekannten erfolgreichen Anwendungen beschrankt. Personen, die eine 
empirische Theorie vertreten, unterstellen vielmehr eine gewisse Allgemeingiiltigkeit 
der Theorie. Sie nehmen dabei meist gar nicht in naiver Weise an, dass die Theorie 
fur alle Objekte, Situationen und Phanomene adaquate Beschreibungen und 
Erklarungen liefern kann. Sie sind aber in der Regel uberzeugt, dass die Theorie auch 
in alien Situationen erfolgreich anwendbar ist, die bisherigen erfolgreichen Anwen- 
dungen in wesentlichen Merkmalen ausreichend ahnlich sind. 

Zu jeder erfolgreichen Anwendung eines Theorie-Elements gibt es also eine 
Menge hinreichend ahnlicher Partialmodelle, fiir die ohne empirische Priifung 
angenommen wird, dass sie zu Modellen des Theorie-Elements erganzt werden 
konnen. Wir bezeichnen diese Partialmodelle als vermutete Anwendungen und 
fassen sie zur Untermenge I v zusammen. Die Annahme I v c G ist dann Teil der 
empirischen Behauptung, die mit diesem Theorie-Element verbunden ist. 

Aussagen iiber vermutete Anwendungen beinhalten keine deduktiv-sicheren 
Schlusse, sondern induktive, mit Unsicherheit behaftete Erwartungen. Diese haben 
wir im Kapitel 4.2 als empirische Vermutungen bezeichnet. Da diese Vermutungen 
sich auch als falsch herausstellen konnen, ist in Abbildung 11.7 die Darstellung so 
gewahlt, dass nur ein Teil der Menge der vermuteten Anwendungen tatsachlich auch 
Teilmenge des Geltungsbereichs ist. 

0 Zu den intendierten Anwendungen der dissonanztheoretischen Elemente DissFI72, 
DissF.S, DissF und DissB gehort nicht nur das Partialmodell, das der experimentellen 
Situation von Frey und Irle entspricht, sondern auch alle Partialmodelle, die mogliche 
ahnliche Anwendungssituationen beschreiben. Von der untersuchten Situation konnen sie 
sich beispielsweise dadurch unterscheiden, dass das Experiment ein Jahr spater stattfindet 
oder dass Ludwigshafener statt Mannheimer Gymnasiasten untersucht werden oder dass 
eine Rede und kein Aufsatz ausgearbeitet werden muss. Nach dem vorliegenden 
Fachwissen konnen wir annehmen, dass keiner dieser Unterschiede einen wesentlichen 
Einfluss auf das empirische Ergebnis hat. 
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Die Menge I v der vermuteten Anwendungen unterscheidet sich in zwei wesentlichen 
Merkmalen von den beiden Teilmengen der paradigmatischen und der 
nachfolgenden erfolgreichen Anwendungen. Erstens umfasst die Menge I v stets 
unendlich viele Elemente, da zu jeder erfolgreichen Anwendung unendlich viele 
hinreichend ahnliche Anwendungen denkbar sind. Zweitens ist die Menge I v nur 
vage abgegrenzt, denn es ist haufig nicht eindeutig zu entscheiden, ob eine mogliche 
Anwendung noch hinreichend ahnlich zu einer erfolgreichen Anwendung ist oder 
nicht. 

0 Wenn 1999 Rostocker Lehrlinge einen Aufsatz gegen die Senkung des Wahlalters 
schreiben sollen und dafiir mit 1 DM oder 8 DM belohnt werden, ist es fraglich, ob die 
Giiltigkeit der Dissonanztheorie ohne empirische Priifung unterstellt werden kann. Die 
Unterschiede zwischen dieser moglichen Anwendung der Theorie und der bekannten 
erfolgreichen Anwendung von Frey und Irle konnen durchaus zu veranderten 
Beziehungen zwischen den betrachteten Variablen fiihren. Ist das Thema fur diese 
Jugendlichen so bedeutsam, dass uberhaupt Dissonanz entstehen kann? Ist ein 
einstellungskontrarer Aufsatz fur sie uberhaupt selbstkonzepttangierend oder sind sie 
daran gewohnt, andere Meinungen zu vertreten? Wirken die beiden Geldbetrage 
uberhaupt noch als unterschiedlich hohe Belohnungen? 

(4) Zweifelhafte Anwendungen 

Wenn wir eine Theorie nur auf Situationen anwenden wurden, die den paradig- 
matischen oder nachfolgenden erfolgreichen Anwendungen sehr ahnlich sind, 
wurden wir kaum Informations- und Erkenntniszuwachse erzielen, denn die neuen 
empirischen Ergebnisse wurden im Wesentlichen nur das bestatigen, was wir auf 
Grund der vorliegenden Ergebnisse schon relativ sicher erwarten konnen. 

Fur den wissenschaftlichen Fortschritt ist es deshalb unabdingbar, dass untersucht 
wird, inwieweit eine Theorie auch in Bereichen erfolgreich anwendbar ist, die in 
wesentlichen Aspekten nicht den bisherigen erfolgreichen Anwendungen ahneln. In 
einem solchen Fall haben wir zwar die Hypothese, dass die Theorie auf den zu 
betrachtenden Realitatsausschnitt erfolgreich anwendbar ist, vor der empirischen 
Priifung sind wir aber unsicher, ob diese Hypothese zutreffend ist. Wir sprechen in 
diesem Fall von einer zweifelhaften Anwendung. Die Untermenge der zweifelhaften 
Anwendungen wird als I z bezeichnet. Ihre Elemente sind nur vorlaufig in die Menge 
der intendierten Anwendungen aufgenommen worden, und es wird nur versuchs- 
weise behauptet, dass I z cG gilt, d.h. dass alle zweifelhaften Anwendungen erfolg- 
reiche Anwendungen darstellen. 

• Wenn das Partialmodell a zur Untermenge I z der zweifelhaften Anwendungen 
gehort, bezeichnen wir die Aussage a e G als eine empirische Hypothese. 

Die empirische Hypothese entspricht der Annahme, dass das Theorie-Element in 
diesem moglichen Anwendungsfall auch tatsachlich gilt. Ob eine empirische Hypo- 
these zutreffend ist oder nicht, muss aufgrund der Ergebnisse einer empirischen 
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Untersuchung entschieden werden. Sollten die empirischen Ergebnisse nicht theorie- 
konform sein, kann diese mogliche Anwendung aus der Menge der intendierten 
Anwendungen eliminiert werden. In der Abbildung 11.7 gehort deshalb nur ein Teil 
der Menge I z zum Geltungsbereich G. 

Sprechen die empirischen Ergebnisse dafiir, dass eine erfolgreiche Anwendung 
der Theorie vorliegt, wird das entsprechende Partialmodell zu einer erfolgreichen 
Anwendung, d.h. zu einem Element der Untermenge I e . 

11.8.3 Das Vertreten von Theorien 

Wenn ein konkretes Theorie-Element beschrieben wird, muss streng genommen 
immer mit angegeben werden, fur welchen Wissenschaftler oder welche Wissen- 
schaftlergemeinschaft und in welchem Zeitraum die intendierte Anwendungsmenge 
gelten soil. T p = <K,I,WG t > ist die Schreibweise fur ein derartiges pragmatisch 
anger eichertes Theorie-Element. 600 Sie macht deutlich, dass aus strukturalistischer 
Sicht ein konzeptueller Kern K nur dadurch zu einer empirischen Theorie T wird, 
dass zu einem bestimmten Zeitpunkt t eine bestimmte Wissenschaftlergemeinschaft 
WG t die Absicht hat, sie auf bestimmte Systeme I anzuwenden. 

Ubertragt man diese pragmatische Anreicherung auf ganze Theorie-Netze, konnen 
die Konzeptionen von Kuhn und Lakatos (siehe Kapitel 9.3 und 10.3) innerhalb der 
strukturalistischen Wissenschaftstheorie praziser ausgedriickt werden. 601 

Das Basiselement, aus dem sich alle anderen Elemente des Netzes durch 
Differenzierung ergeben, entspricht dem Paradigma der wissenschaftlichen Gemein- 
schaft im Sinne Kuhns oder dem harten Kern des auf diese Theorie orientierten 
Forschungsprogramms im Sinne von Lakatos. Der Kern des Basiselements reprasen- 
tiert die Begriffe und Zusammenhange, die in alien von der wissenschaftlichen 
Gemeinschaft intendierten Anwendungen der Theorie vorkommen. Die intendierte 
Anwendungsmenge enthalt eine Untermenge I 0 von ersten erfolgreichen Anwen- 
dungen der Theorie, die den paradigmatischen Beispielen ( exemplars ) von Kuhn 
entspricht. 

Die iibrigen auf diesem Basiselement aufgebauten Theorie-Elemente konnen fiber 
die Zeit oder zwischen verschiedenen Mitgliedern der wissenschaftlichen Gemein- 
schaft variieren. Dadurch bestehen bei verschiedenen Untergruppen von WG t unter- 
schiedliche Theorie-Netze. Solange diese aber auf dem gleichen Basiselement 
aufgebaut sind, bewegen sich diese Wissenschaftler im gleichen Paradigma im Sinne 
Kuhns, sie vertreten im Sinne des Strukturalismus die gleiche Theorie. 

Dieses Konzept des Vertretens einer Theorie durch eine wissenschaftliche 
Gemeinschaft soil im Folgenden noch etwas genauer beschrieben werden. Dass 



Stegmtiller (1986, S. 112) 

Stegmiiller (1975, 1985, 1986), Balzer, Moulines & Sneed (1987, S.205-223) 
in Anlehnung an Stegmiiller (1973c, S. 194, 1980, S. 150) und Sneed (1971, S. 266) 
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jedes Mitglied einer wissenschaftlichen Gemeinschaft WG die gleiche Theorie T 
vertritt, bedeutet vereinfacht gesagt folgendes: 

• jedes p e WG kennt und akzeptiert zur Zeit t ein Theorie-Netz N pt , das auf einem 
Basiselement T-B = <K B ,I B > aufgebaut ist; 

• p akzeptiert die Menge I 0 c I B von paradigmatischen Anwendungen fur den 
Basiskern K B ; 

• p ist iiberzeugt, dass es fur die Theorie-Elemente Tj, Tj, ...e N pt nicht-leere 
Mengen I e j, I e ;, ... erfolgreicher Anwendungen gibt, 

• p hat die begriindete Hoffnung auf empirische und theoretische Fortschritte, d.h. 
auf Erweiterung der Mengen der erfolgreichen Anwendungen und auf Einftihrung 
weiterer erfolgreich anwendbarer Theorie-Elemente. 

Die in diesen Punkten enthaltenen Merkmale konnen prinzipiell auf zweierlei Weise 
verwendet werden. Zum einen konnten wir mit ihrer Hilfe fiir jede Person festlegen, 
ob sie zu dieser wissenschaftlichen Gemeinschaft WG, gehort oder nicht. Stringenter 
und den Intentionen Kuhn eher entsprechend ist es aber, wenn wir die wissen- 
schaftliche Gemeinschaft mit Hilfe sozialwissenschaftlicher Kriterien umreiBen 603 
und dann anhand der eben genannten Merkmale priifen, ob alle Mitglieder 
tatsachlich im beschriebenen Sinne die gleiche Theorie T vertreten. Wichtig ist auf 
jeden Fall, dass die Personen das gleiche Basiselement und die gleichen 
paradigmatischen Beispiele akzeptieren. Die darauf aufgebauten Theorie-Netze 
konnen unterschiedlich sein, ebenso die ubrigen (also nicht paradigmatischen) 
intendierten Anwendungen. 



11.9 Theorieentwicklung 

Die Entwicklung einer Theorie liber die Jahre oder Jahrzehnte, in denen sie in einer 
wissenschaftlichen Disziplin vertreten und angewendet wird, kann durch eine 
Aufeinanderfolge von Theorie-Netzen beschrieben werden. Je mehr Theorie-Netze 
man rekonstruiert, desto genauer wird die Theorieentwicklung nachgezeichnet. 
Solange das Basiselement konstant bleibt, konnen wir von der gleichen Theorie 
sprechen. Bei Veranderung des Basiselements dagegen liegt eine neue Theorie vor. 

11.9.1 Wissenschaftliche Fortschritte und Ruckschlage 

Der Vergleich verschiedener Theorie-Netze kann zum einen wissenschaftliche 
Fortschritte und Ruckschlage anzeigen, zum anderen konnen diese Fortschritte und 
Riickschritte sich auf das Theoretische und auf das Empirische beziehen. Wir konnen 
damit vier Grundformen der Wissenschaftsentwicklung unterscheiden: 604 



siehe oben Seite 198 

modifiziert nach Stegmiiller (1979, S. 33; 1980, S. 114-115) 
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• Jede Verfeinerung des Theorie-Netzes, das heiBt die Einfiihrung eines neuen 
Theorie-Elements, ist ein theoretischer Fortschritt. 

0 Die wesentlichen theoretischen Fortschritte in der Entwicklung der Dissonanztheorie 
stellen Theorie-Elemente wie DissF.S und DissB.S dar, die jeweils die Bedingungen 
genauer spezifizieren, unter denen iiberhaupt Dissonanz auftreten soil. 

0 Neue Theorie-Elemente mit neuen Spezialbegriffen und Spezialaxiomen konnen sich 
auch auf intendierte Anwendungsbereiche beziehen, die weit von den paradig- 
matischen Anwendungen entfernt sind. Die Dissonanztheorie ist beispielsweise auch 
auf unvorhersehbare negative Handlungskonsequenzen, unnotige Anstrengungen in 
Leistungssituationen und Zufriedenheit mit der Arbeit angewendet worden. 605 

• Die Ausdehnung der Menge der intendierten Anwendungen ist ein empirischer 
Fortschritt. 

0 Es liegen zahlreiche Experimente zur Dissonanztheorie vor, deren Ergebnisse mit den 
Vorhersagen aus der Theorie iibereinstimmen. 606 Die Entwicklung der Dissonanz- 
theorie kann deshalb als empirisch progressiv bezeichnet werden. 

• Ein empirischer Riickschlag entsteht, wenn eine zweifelhafte, d.h. eine 
versuchsweise aufgenommene Anwendung nach den empirischen Ergebnissen 
keine erfolgreiche Anwendung ist. 

0 Die erwahnten Experimente, die keine divergierende, sondern konvergierende 
Attraktivitaten zwischen gewahlten und nicht-gewahlten Alternativen zeigten, waren 
empirische Ruckschlage fiir die urspriingliche Theorieform. 

• Ein theoretischer Riickschlag tritt ein, wenn eine Verfeinerung des Netzes zuriick- 
genommen werden muss, das heiBt, wenn sich fiir ein bestimmtes Theorie- 
Element keine oder nicht gentigend erfolgreiche Anwendungen finden lassen. 

0 Festingers urspriingliche Annahme, dass Personen generell Informationen vermeiden, 
durch die die Dissonanz ansteigt, erwies sich als empirisch nicht haltbar. Die 
entsprechenden Theorie-Elemente (die als Differenzierungen des Bereichselements 
DissI zu rekonstruieren sind) mussten modifiziert bzw. aufgegeben werden. 

Da alle empirischen Befunde fallibel, also moglicherweise falsch sind, folgt keiner 
dieser wissenschaftlichen Entwicklungsfortschritte oder -ruckschlage mit logischer 
Zwangslaufigkeit aus den empirischen Befunden. Alle Veranderungen im Theorie- 
Netz oder den intendierten Anwendungsmengen der Theorie-Elemente beruhen auf 
Entscheidungen, die (mehr oder minder bewusst und mehr oder minder stringent) auf 
der Basis der vorliegenden empirischen Befunde getroffen werden. 

Empirische und theoretische Fortschritte oder Ruckschlage sind deshalb immer 
vorlaufig und revidierbar. 



Adams (1965), Bossong (1982), Irle & Montmann (1978, S. 352-365) 

Cooper & Fazio (1984), Frey et al. (1982), Irle & Montmann (1978), Weiner (1992) 
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0 Einige friihe Anwendungen der Dissonanztheorie konnten wieder aus der Menge der 

erfolgreichen Anwendungen eliminiert werden, weil sie methodische Mangel 

r ■ 607 

autweisen. 

Empirische Riickschlage konnen theoretische Fortschritte einleiten: wenn es gelingt, 
neue oder modifizierte Theorie-Elemente zu schaffen, die die abweichenden 
Ergebnisse befriedigend erklaren konnen und in anderen Kontexten erfolgreich 
anwendbar sind. Die modifizierte Theorie ist im Sinne von Popper besser und 
wahrheitsnaher, es liegt eine progressive Entwicklung im Sinne von Lakatos vor. 608 

0 Die Experimente mit konvergierenden Attraktivitatsunterschieden stellten zunachst 
empirische Riickschlage dar, fuhrten dann aber zu einem theoretischen Fortschritt durch 
die Annahme, dass vor den Dissonanzeffekten Effekte des Bedauerns ( regret effects ) 
eintreten (siehe oben Kapitel 11.4.2). 



11.9.2 Die empirische Immunitat von Theorien 

Aus strukturalistischer Sicht ergibt sich eindeutig, dass eine Theorie nicht 
falsifizierbar im Sinne von Popper ist. Sie ist vielmehr „immun“ gegeniiber 
„aufsassigen Erfahrungen“. 609 Fiir diese Immunitat gibt es zwei hauptsachliche 
Griinde: die Offenheit und Modifizierbarkeit der intendierten Anwendungsmenge 
und die Offenheit und Modifizierbarkeit des Theorie-Netzes. 

Deuten empirische Untersuchungsergebnisse darauf hin, dass ein Theorie- 
Element auf eine bestimmte Situation nicht erfolgreich anwendbar ist, kann das 
entsprechende Partialmodell aus der Menge der zweifelhaften Anwendungen und 
damit aus der Gesamtmenge der intendierten Anwendungen entfernt werden. Damit 
werden auch ahnliche Partialmodelle aus der Menge der intendierten Anwendungen 
entfernt. Die empirische Behauptung, die mit dem Theorie-Element verbunden ist, 
wird entsprechend eingeschrankt. Man behauptet also nicht mehr, dass die Theorie 
diesen Realitatsbereich adaquat beschreiben und erklaren kann. 

In einem theorie-orientierten Forschungsprogramm wird man dann in anderen 
Bereichen nach erfolgreichen Anwendungen suchen. Befindet man sich in einem 
Forschungsprogramm, das nicht um eine bestimmte Theorie, sondern um einen 
bestimmten Phanomen- oder Problemkomplex herum zentriert ist, wird man andere 
Theorien zur Beschreibung und Erklarung heranziehen. 610 

Die empirische Behauptung zu einem Theorie-Element beinhaltet nicht nur 
(relativ) sicheres Wissen (liber bisherige erfolgreiche Anwendungen), sondern auch 



607 



608 

609 

610 



Bredenkamp (1972, S. 90-96), Chapanis & Chapanis (1964). Diese mogliche Elimina- 
tion kann allerdings unterbleiben, weil verbesserte nachfolgende Experimente die Er- 
gebnisse im Wesentlichen bestatigten, diese also offenbar von den Mangeln nicht durch- 
schlagend verfalscht worden sind (Frey, 1984; Irle & Montmann, 1978). 
siehe oben Kapitel 10.2.2 und Kuipers (1996) 

Stegmiiller (1980, S. 121) 

zu psychologischen Forschungsprogrammen: Herrmann (1976) und oben Kapitel 9.3.3 
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unsichere Vorhersagen und Erwartungen (iiber vermutete oder zweifelhafte 
Anwendungen). Die wissenschaftlichen Gesetze, die durch die Elemente eines 
Theorie-Netzes dargestellt werden, sind deshalb stets Gesetzesannahmen: Sie geben 
nicht an, was unbedingt sein muss, sondern was erwartet werden kann. 

Der Anwendungsbereich fur ein bestimmtes Theorie-Element liegt also nicht 
unveranderlich fest, sondern hangt davon ab, unter welchen Bedingungen sich der 
Theoriekern als erfolgreich anwendbar erweist. Es liegt eine partielle Auto- 
determination vor: Theorien bestimmen ihren Anwendungsbereich teilweise 
selbst. 611 

Wird ein ganzes Theorie-Element aus dem Netz entfernt, muss dies die Kerne und 
intendierten Anwendungen in anderen Anwendungsbereichen nicht tangieren. 

0 Die an Skinners Theorie des operanten Verhaltens orientierte Forschung enthalt 
verschiedene Versuche, neue erfolgreiche Anwendungsgebiete der Theorie zu finden. So 
ist versucht worden, den Spracherwerb beim Kinde als operantes Lernen zu erklaren. 612 
Auch wenn derartige Versuche scheitern und aufgegeben werden, ist das grundlegende 
Theorie-Element der operanten Verhaltenstheorie keineswegs als falsifiziert anzusehen. 
Vielmehr wird nur die Behauptung (vorlaufig) zuriickgenommen, dass Sprach- 
entwicklungsprozesse spezifische Formen operanten Verhaltens sind. Das ist aber noch 
kein Grand, die Behauptung zuruckzunehmen, dass die Theorie erfolgreich beispiels- 
weise auf zwangsneurotisches Verhalten anwendbar ist. 

Es gibt keine empirischen Daten, die mit dem Basiselement unvereinbar sind: Da die 
substanziellen Axiome der Basiselemente sich auf theoriespezifische Begriffe 
beziehen, haben sie keinen empirischen Gehalt (siehe Kapitel 11.7.3). Daher ist es 
nicht gerechtfertigt, eine Theorie ganz zu verwerfen, wenn die Bemiihungen 
scheitern, bestimmte Theorie-Elemente auf bestimmte Situationen anzuwenden. Es 
gibt keinen Grand, dieses Scheitern der Theorie insgesamt anzulasten und sie als 
irgendwie „falsifiziert“, „erschiittert“ oder „belastet“ zu bezeichnen. Die Theorie hat 
sich zumindest bei den paradigmatischen Anwendungen bewahrt und kann noch 
Generationen von Wissenschaftlern in bestimmten Kontexten gute Dienste leisten. 

11.9.3 Mogliche Ziele der wissenschaftlichen Forschung 

Popper hat gezeigt, dass das Ziel der wissenschaftlichen Forschung nicht darin 
bestehen kann, zu sicheren, wahren Aussagen iiber die Realitat zu gelangen. Nach 
seiner Auffassung soil Forschung darauf gerichtet sein, die Falschheit von Theorien 
aufzuzeigen und sie durch Verbesserung naher an die Realitat heranzufiihren. 

Aus strukturalistischer Sicht zeigt sich, dass Theorien auch nicht falsifizierbar, 
sondern weitgehend „immun“ gegentiber Erfahrungen sind. Von den Ergebnissen 
empirischer Untersuchungen direkt beeinflusst werden nur die Aussagen dariiber, auf 



611 Stegmuller (1985, S. 225) 

612 Bower & Hilgard (1983, S. 280-282, 300-303) 
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welche Falle die Theorie erfolgreich anwendbar ist und auf welche nicht: Neue 
erfolgreiche Anwendungen konnen hinzukommen, zweifelhafte oder vermutete 
Anwendungen miissen eventuell aus der Menge der intendierten Anwendungen 
entfernt werden. Die empirischen Behauptungen und Hypothesen werden also in 
Abhangigkeit von den Ergebnissen empirischer Untersuchungen bestandig verandert. 

Das Ziel der Wissenschaft kann deshalb nicht darin bestehen, eine Theorie 
insgesamt zu verifizieren, zu falsifizieren, zu bewahren oder zu erschiittern. Die 
wissenschaftliche Arbeit soli vielmehr zu Erkenntnisgewinnen fiihren, das heiBt zu 
einer Zunahme unseres Wissens iiber die betrachteten Bereiche. Dies beinhaltet 
sowohl empirische wie theoretische Erkenntnis: Es gilt, das Wissen iiber empirische 
Zusammenhange zu vermehren und die theoretischen Erklarungen fur diese Zusam- 
menhange zu verbessern. Theoretisches und empirisches Wissen existieren nicht 
unabhangig voneinander, sondern sind unauflosbar in den empirischen 
Behauptungen der Theorien und Theorie-Elemente miteinander verbunden. 

Am deutlichsten werden Erkenntnisgewinne in den theoretischen und empirischen 
Fortschritten einer Wissenschaft. Jede erfolgreiche Anwendung der Theorie auf eine 
neue Situation und jede Weiterentwicklung der Theorie stellt eine Vermehrung 
unseres empirischen bzw. theoretischen Wissens liber den betrachteten Gegenstands- 
bereich dar. Aber auch in empirischen oder theoretischen Riickschlagen liegt 
Erkenntnisgewinn: Wir erfahren, dass die erwarteten Zusammenhange nicht bestehen 
oder dass eine Ausgestaltung der Theorie nicht aufrechtzuerhalten ist. 

Ein ganz wesentliches Ziel der empirischen Forschung ist damit die Abgrenzung 
der erfolgreichen Anwendungsbereiche der wissenschaftlichen Theorien: Fiir jedes 
Theorie-Element ist die Menge I e so eindeutig wie moglich gegen die Anwendungen 
abzugrenzen, die nicht zum Geltungsbereich gehoren. Die Abgrenzung erfolgreicher 
und nicht-erfolgreicher Anwendungen bedeutet, dass man nach Faktoren sucht, die 
mit den Ursachenvariablen (disordinal) interagieren (siehe Kapitel 16. 5). 613 

Jede empirische Untersuchung, in der die empirische Hypothese geprlift wird, 
dass ein bestimmtes Theorie-Element auf bestimmte Personen in einer bestimmten 
Situation anwendbar ist, tragt zu dieser Abgrenzung erfolgreicher und nicht- 
erfolgreicher Anwendungen bei. Die folgenden Kapitel beschaftigen sich mit der 
Planung, Durchfiihrung und Auswertung von empirischen und insbesondere von 
experimentellen Untersuchungen. 



613 



vgl. Greenwald, Pratkanis, Leippe & Baumgardner (1986) zur Abgrenzung des 
Anwendungsbereiches fiir den „Schlafer-Effekt“ bei der Kommunikationswirkung 





12 Grundzuge der Experimentalmethodik 



Im Kapitel 1.3 haben wir ein weites Spektrum von Untersuchungsarten kennen 
gelernt, das in der psychologischen Forschung angewendet wird. Es reichte von 
kontrollierten Laboruntersuchungen bis zu Evaluationen gesellschaftlicher Institutio- 
nen. Eine zentrale Stellung nehmen dabei die experimentellen Untersuchungen ein, 
denn sie sind am besten geeignet, wissenschaftliche Hypothesen liber kausale 
Zusammenhange zu uberpriifen. In diesem Kapitel 12 und den folgenden Kapiteln 13 
bis 18 werden wir uns mit Fragen der experimentellen Versuchsplanung 
beschaftigen: Wie miissen wir ein Experiment gestalten, durchflihren und auswerten, 
damit wir eine moglichst gute Priifung unserer Kausalhypothese bekommen? 

Im Kapitel 12.1 wollen wir zunachst die wesentlichen Eigenschaften psychologi- 
scher Experimente anschaulich kennzeichnen und die experimentelle Methode 
definitorisch abgrenzen. Dann werden wir die wichtigsten experimentellen 
Versuchsplane ( designs ) kennen lernen (Kapitel 12.2). Im Kapitel 12.3 wird 
geschildert, wie eine experimentelle Untersuchung in der Psychologie typischerweise 
ablauft und wie sie in wissenschaftlichen Zeitschriften der Fachoffentlichkeit 
vorgestellt wird. Im Theorieteil werden die wissenschaftlichen Fragestellungen und 
Hypothesen spezifiziert (Kapitel 12.3.1). Im Methodenteil werden die Unter- 
suchungsbedingungen und -ablaufe festgelegt und die empirischen Hypothesen und 
Vorhersagen abgeleitet (Kapitel 12.3.2). Im Ergebnisteil werden empirische 
Ergebnisse beschrieben, statistische Hypothesen gepriift und die GroBe der 
erhaltenen Effekte ermittelt (Kapitel 12.3.3). Im Diskussionsteil schlieBlich werden 
die wissenschaftlichen Fragestellungen und Hypothesen aufgrund der Ergebnisse zu 
beantworten versucht (Kapitel 12.3.4). 614 



614 Diese Kapitel basieren wesentlich auf dem Enzyklopadieartikel zur Planung und 
Auswertung von Experimenten (Hager & Westermann, 1983a), auf wegweisenden 
Arbeiten von Jurgen Bredenkamp (1969a, 1972, 1980) und Volker Gadenne (1976) 
sowie auf den Weiterentwicklungen von Willi Hager (1987, 1992b). 

Eine trefflich illustrierte erste Einfiihrung in die Experimentalmethodik stammt von 
Huber (1995). Ausfiihrlichere Darstellungen geben Holzkamp (1964), Selg (1975), 
Traxel (1974), Kerlinger (1978), Schulz, Muthig & Koeppler (1981), Snodgrass, Levy- 
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12.1 Kennzeichen von Experimenten 

Zur Charakterisierung von psychologischen Experimenten bieten sich vier haupt- 
sachliche Merkmale an: die absichtliche Herstellung oder Auswahl von situativen 
Bedingungen, die systematische Variation der Bedingungen, die Betrachtung der 
Auswirkungen der vorgenommenen Bedingungsvariationen und die Kontrolle ande- 
rer moglicher Einflussfaktoren. 

(1) Absichtliche Herstellung oder Auswahl von Untersuchungsbedingungen 

Nach Wilhelm Wundt ist die Willkiirlichkeit , mit der die Bedingungen hergestellt 
werden konnen, das erste und wichtigste Definitionskriterium fiir Experimente. 615 
Der Begriff der Willkiirlichkeit wird heute leicht missverstanden: „Willktirlich“ 
meint nicht „unbegriindet“ oder „zufallig“, sondern „frei wahlbar“ oder „absicht- 
lich“. AuBerdem muss eine experimentelle Bedingung nicht unbedingt vom Experi- 
mentator selbst willklirlich hergestellt werden. Sie kann auch von anderen Instanzen 
hergestellt und vom Experimentator frei ausgewahlt werden. 

0 Will man untersuchen, ob man die Hyperaktivitat von Kindern durch eine operante 
Gegenkonditionierung verringern kann, muss man eine Situation herstellen (z.B. im 
Beobachtungsraum eines psychologischen Instituts) oder auswahlen (z.B. im Spiel- 
zimmer einer Kinderklinik), die es gestattet, jede ruhige Aktivitat eines Kindes (z.B. 
durch ein Lob) zu verstarken. 

Insbesondere wenn die experimentellen Bedingungen absichtlich und gezielt 
hergestellt sind, bezeichnet man sie auch als experimentelle Behandlungen 
(; treatments ), und zwar auch dann, wenn es sich nicht um eine medizinische oder 
klinisch-psychologische Behandlung im engeren Sinn handelt. 

Berger & Haydon (1985), Solso & Johnson (1989), Sarris (1990), McGuigan (1993), 
Levine & Parkinson (1994) und MacBurney & Middleton (1994). 

Etliche englischsprachige Standardwerke zur Versuchsplanung ( experimental design ) 
akzentuieren die statistischen Auswertungsmethoden starker als die konzeptuellen 
Planungsprobleme (Keppel, 1991; Kirk, 1995; Winer, Brown & Michels, 1991). 
Wertvolle Hinweise fiir die Durchfuhrung von Experimenten und Quasi-Experimenten 
auBerhalb des Labors („im Feld 44 ) finden sich bei Cook & Campbell (1979). AuBerdem 
gibt es spezielle Einflihrungen in die Experimentalmethodik z.B. fiir die 
Sozialpsychologie (Aronson, Brewer & Carlsmith, 1985), die Padagogische Psychologie 
(Campbell & Stanley, 1963), die Klinische Psychologie (Ferstl & Niebel, 1983) die 
Arbeits- und Organisationspsychologie (Cook & Campbell, 1976) und die 
Evaluationsforschung (Boruch, 1997). 

Viele konkrete Hinweise finden sich in Anleitungen fiir Experimentalpraktika 
(Heckhausen, 1969; Irtel, 1993b; Liier, 1987; Pauli & Arnold, 1972; Sarris, 1985). Bei 
der Durchfuhrung von Experimenten sind entsprechende Computerprogramme hilfreich 
(Beringer, 1994; Hunt, 1994; Irtel, 1993a). 

Zur Geschichte des Experiments in der Psychologie: Wertheimer (1986). 

615 Hofstatter (1957, S. 100) 
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(2) Systematische Variation der Bedingungen 

Um die Auswirkungen der experimentellen Behandlung systematisch zu untersu- 
chen, werden die experimentellen Bedingungen gezielt verandert. Diese Variierbar- 
keit ist nach Wundt die zweite notwendige Eigenschaft eines Experimentes. 616 

0 Um die Wirkung der operanten Gegenkonditionierung zu untersuchen, wird bei den 
Kindern der Behandlungsgruppe ruhige Aktivitat stets durch Lob verstarkt, bei der 
Kontrollgruppe jedoch nicht. 

Schematisch werden die Experimentalbedingungen in einem Versuchsplan ( design ) 
dargestellt. Die wichtigsten Versuchsplane werden im Kapitel 12.2 beschrieben. 

(3) Betrachtung der Auswirkungen der Bedingungsvariationen 

Um die Auswirkungen der vorgenommenen Bedingungsvariationen bestimmen zu 
konnen, wird eine abhdngige Variable festgelegt, deren Auspragungen unter den 
verschiedenen Bedingungen ermittelt und verglichen werden. Werden zur Erfassung 
der interessierenden Auswirkungen zwei oder mehr abhangige Variablen betrachtet, 
liegt ein multivariates Experiment vor. 

0 Bei der operanten Gegenkonditionierung hyperaktiver Kinder ist die Haufigkeit hyper- 
kinetischer Verhaltensweisen (z.B. pro Stunde in einer standardisierten Umgebung) eine 
mogliche abhangige Variable Y. Ein zweites adaquates Ma6 fur den Erfolg der 
Verhaltensmodifkation ist beispielsweise die subjektive Einschatzung der Eltern iiber die 
Angemessenheit des kindlichen Verhaltens (abhangige Variable Y’). 

(4) Kontrolle anderer moglicher Einflussfaktoren 

Treten in den Experimentalbedingungen unterschiedlich hohe Werte der abhangigen 
Variablen auf, sind diese Unterschiede nur dann eindeutig durch die unter- 
schiedlichen Behandlungen verursacht, wenn es liber die gezielt hergestellte Varia- 
tion der Bedingungen hinaus keine relevanten und systematischen Unterschiede zwi- 
schen den Experimentalbedingungen und den in ihnen untersuchten Personen gibt. 
Deshalb muss man unbedingt versuchen, die Wirkung anderer moglicherweise 
ergebnisrelevanter Einflussfaktoren auszuschalten. 

0 Die Verhaltenshaufigkeiten nach der operanten Konditionierung konnen nicht nur vom 
Verstarkungsplan beeinflusst werden, sondern auch von der Kompetenz der Therapeuten 
oder der erfahrenen Zuwendung. 



616 Hofstatter (1957, S. 100). Eine dritte notwendige Eigenschaft von Experimenten ist nach 
Wundt die Wiederholbarkeit. Dies folgt bereits aus der Willkiirlichkeit: Wenn 
experimentelle Bedingungen frei hergestellt werden konnen, dann lassen sie sich auch 
wiederholt herstellen. Psychologische Experimente sind aber nicht in alien Aspekten 
wiederholbar, denn Personen verandern sich stets iiber die Zeit. 
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1st ein mutmaBlicher Einflussfaktor bekannt, kann sein Einfluss kontrolliert werden, 
indem er konstant gehalten oder gleichmaBig verteilt wird (siehe Kapitel 14.2). 

0 Der eventuelle Einfluss unterschiedlicher Kompetenzen oder Personlichkeitsmerkmale 
der Versuchsleiter kann dadurch ausgeschaltet werden, dass entweder nur ein einziger 
Versuchsleiter verwendet wird (Konstanthaltung) oder dass jeder Versuchsleiter gleich 
haufig in jeder Experimentalbedingung eingesetzt wird (Gleich verteilung). 

0 Wenn in den Experimentalbedingungen ohne und mit Verstarkung das AusmaB an 
Zuwendung und Lob, das die Kinder erhalten, systematisch unterschiedlich sind, konnen 
sie die abhangige Variable beeinflussen und eine Wirkung der Verstarkungstechniken 
vortauschen oder verdecken. Um das zu vermeiden, miissen sie in alien Bedingungen 
konstant gehalten werden. Die Kinder der Kontrollgruppe erhalten deshalb genau so 
haufig Lob wie die der Verstarkungsgruppe, aber unabhangig vom Verhalten. 

Unbekannte Einflussfaktoren konnen durch Zufallszuordnung (Randomisierung) in 
ihrem Einfluss kontrolliert werden (siehe im einzelnen Kapitel 14.3). Besonders 
wichtig ist die Zufallszuordnung der Untersuchungspersonen zu den Untersuchungs- 
bedingungen. Zumindest auf lange Sicht werden dadurch alle moglichen Merkmale 
der Personen gleichmaBig auf alle Bedingungen verteilt. 

0 Wenn die Kinder den Experimentalbedingungen zufallig zugeordnet werden, wird die 
Wahrscheinlichkeit minimiert, dass die meist unbekannten moglichen Ursachen fur die 
hyperkinetischen Verhaltensauffalligkeiten das Ergebnis systematisch beeinflussen. 

Definition des Experiments 

Experimente werden durchgefuhrt, um wissenschaftliche Kausalhypothesen 
empirisch zu priifen. Dazu miissen die angenommenen Ursachenfaktoren variiert und 
andere mogliche Einflussfaktoren kontrolliert werden. Dies ist nur moglich, wenn 
jeweils mehrere Untersuchungseinheiten (Tiere, Menschen, Gruppen) einer Bedin- 
gung ausgesetzt werden. Da die Storvariablen nie vollstandig bekannt sind, erfordert 
ihre Kontrolle immer die zufallige Zuordnung der Untersuchungseinheiten zu den 
Untersuchungsbedingungen. Die Randomisierung stellt deshalb das definierende 
Kriterium fiir psychologische Experimente dar: 

• Eine Untersuchung ist genau dann ein Experiment, wenn die Untersuchungs- 
einheiten zufallig den Untersuchungsbedingungen (bzw. den Untersuchungs- 
reihenfolgen bei intra-individueller Bedingungsvariation) zugeordnet sind. 

Nach unserer Definition ist die Randomisierung damit notwendige und hinreichende 
Bedingung fiir das Vorliegen eines Experimentes. Abweichend von Wundt kann 
damit auch eine Untersuchung als Experiment bezeichnet werden, bei der die 
Bedingungsvariation weder willkurlich noch wiederholbar ist. 

0 Durch die Universitatsverwaltung werden fiir den Praparierkurs der Medizinstudenten 
computergestutzte Arbeitsplatze eingerichtet. Da die Finanzmittel nur fiir genau die 
Halfte der Studenten ausreichen, wird durch Los bestimmt, welche Studenten 
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herkommlich und welche mit Computern unterrichtet werden. Ein empirischer Vergleich 
des Lernerfolgs in beiden Unterrichtsbedingungen ist aufgrund der vorliegenden 
Randomisierung eine experimentelle Untersuchung. Da die Bedingungsvariation von 
AuBen vorgegeben wurde, ist sie nicht willkiirlich und auch nicht unbedingt 
wiederholbar. 



12.2 Experimentelle Versuchsplane 

Schematisch werden die verschiedenen Experimentalbedingungen in einem 

/'in 

Versuchsplan ( design ) dargestellt. Wird genau ein Aspekt der experimentellen 
Bedingungen variiert, wird dadurch ein experimenteller Faktor definiert und die 
Untersuchung hat genau eine unabhdngige Variable (UV) ( single-factor design, 
Kapitel 12.2.1). Werden unabhangig voneinander mehrere Aspekte der Situation 
verandert, umfasst der Versuchsplan mehrere Faktoren (factorial design, Kapitel 
12.2.2). Werden die Personen nacheinander unter mehreren Bedingungen oder zu 
wiederholten Gelegenheiten untersucht, liegt ein Versuchsplan mit Mess- 
wiederholung vor (repeated-measures design, Kapitel 12.2.3). 

12.2.1 Einfaktorielle Versuchsplane 

Im einfachsten Fall wird eine Behandlungsbedingung mit einer Kontrollbedingung 
verglichen. Die Vergleichsbedingung beinhaltet die spezifische Behandlung nicht. 
Sie wird in moglichst alien anderen Aspekten aber genau so behandelt wie die 
Behandlungsgruppe. In diesem Fall hat die UV zwei Auspragungen (auch Stufen 
oder Modalitaten genannt). Ist die UV mit A bezeichnet, heiBen die Auspragung z.B. 
A| und A 2 . 

0 Um die Wirkung der operanten Gegenkonditionierung zu untersuchen, wird bei den 
Kindern der Behandlungsgruppe ruhige Aktivitat stets durch Lob verstarkt, bei der 
Kontrollgruppe jedoch nicht. Wir haben dann die UV A („Verstarkungsplan“) mit den 
Auspragungen A! („ohne Verstarkung“) und A 2 („kontinuierliche Verstarkung“). 

Die in Tabelle 12.1 eingetragenen y-Werte symbolisieren die Werte der abhangigen 
Variablen bei den einzelnen Untersuchungseinheiten. Der erste Index bezeichnet wie 
tiblich die Zeile, der zweite die Spalte, zu der der jeweilige Wert gehort. Die Zahl der 
Untersuchungseinheiten in der Bedingung Ai wird allgemein mit n bezeichnet, die 
Anzahl in Bedingung A 2 mit m. Die letzte Zeile enthalt die arithmetischen Mittel- 
werte fur die beiden Untersuchungsbedingungen. Statistisch ausgewertet werden 
derartige Zweigruppenplane in der Regel durch t-Tests. 



617 Genauer kann man unterscheiden zwischen den in Experimenten tatsachlich realisierten 
Versuchspldnen und den moglichen Versuchsplan- Anlagen (-Layouts) zur Anordnung 
der unabhangigen Variablen und ihrer Auspragungen (Hager, 1987, S. 56). 
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Tabelle 12.1: Einfaktorieller Versuchsplan mit zwei Auspragungen 



A, 


A2 


yn 


yi2 


Y21 


y22 


• • • 

Ym 


• • • 

y m 2 


Xl 


12 



Sollen verschiedene Arten oder Auspragungen der Behandlung verglichen werden, 
konnen weitere experimentelle Bedingungen eingefiihrt werden. Dadurch erhalt man 
eine unabhangige Variable mit mehr als zwei Auspragungen. Ein Beispiel fur einen 
entsprechenden Versuchsplan enthalt Tabelle 12.2. 



Tabelle 12.2: Einfaktorieller Versuchsplan mit drei Auspragungen 
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0 Neben der Kontrollbedingung ohne Verstarkung von ruhigem Verhalten (Ai) konnen 
zwei Experimentalbedingungen mit unterschiedlichen Verstarkungsplanen hergestellt 
werden: In der Bedingung A 2 werden alle ruhigen Verhaltensweisen verstarkt 
(kontinuierliche Verstarkung), in einer weiteren Experimentalbedingung A 3 nur ein 
bestimmter Anteil von z.B. 20% (intermittierende Verstarkung). 

Statistisch ausgewertet werden derartige Versuchsplane mit drei oder mehr 
Auspragungen oft durch eine einfaktorielle Varianzanalyse. 618 Hat die unabhangige 
Variable eine groBere Zahl von quantitativ unterschiedlichen Auspragungen, kann 
der Zusammenhang mit der abhangigen Variablen gezielter mit Hilfe von 
Regressions- und Trendanalysen beschrieben und gepriift werden. 619 



618 

Eine rein varianzanalytische Auswertung ist meist nicht optimal (siehe Kapitel 15). 

619 Zur einfaktoriellen Varianzanalyse: Bortz (1999, Kap. 7), Hays (1994, Kap. 10); zur 
linearen Regression: Bortz (1999, Kap. 13.2), Hays (1994, Kap. 14); zur Trendanalyse: 
Bortz (1999, Kap. 7.4), Bredenkamp (1968), Hager (1996a), Hays (1994, Kap. 16), 
Keppel (1991, Kap. 7). 

In SPSS konnen diese Analysen im Menu Allgemeines lineares Modell durchgefiihrt 
werden (Syntaxbefehle: UNIANOVA und GLM bzw. MANOVA flir altere Versionen), es 
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12.2.2 Mehrfaktorielle Versuchsplane 

Wird gleichzeitig die Auswirkung mehrerer Faktoren untersucht, ergibt sich ein 
mehr- oder multifaktorieller Versuchsplan. Ein Versuchsplan mit zwei Faktoren mit 
zwei bzw. drei Auspragungen ist in Tabelle 12.3 dargestellt. 



Tabelle 12.3: Zweifaktorieller vollstandig gekreuzter Versuchsplan 
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0 In dem Experiment zur operanten Gegenkonditionierung der hyperaktiven Kinder kann 
neben der unabhangigen Variablen „Verstarkungsplan“ (UV A) mit den Auspragungen 
„ohne Verstarkung“ (Ai) und „kontinuierliche Verstarkung“ (A 2 , Versuchsplan siehe 
Tabelle 12.1) als zwei ter Faktor B die „Art der gegebenen Verstarkung“ variiert werden 
(unabhangige Variable B mit den drei Auspragungen Lob, SuBigkeiten und Geld). Es gibt 
dann 2-3 = 6 Behandlungsbedingungen, und jede von ihnen ist eine Kombination aus 
einem Verstarkungsplan und einer Verstarkungsart. 

Jede der Zellen dieses A x B - Versuchsplans symbolisiert eine der sechs moglichen 
Kombinationen je einer Auspragung des Faktors B mit einer Auspragung des Faktors 
A. Wenn jeder Bedingungskombination eine bestimmte Anzahl von Untersuchungs- 



gibt daftir aber auch spezielle Module (Menus: Mittelwerte vergleichen bzw. Regression, 
Syntaxbefehle: MEANS, BREAKDOWN, ONEWAY bzw. REGRESSION). 
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einheiten zufallig zugewiesen wird, bezeichnet man die Faktoren A und B als 
„vollstandig gekreuzt“ ( completely randomized factorial design). 

Zur Bezeichnung der Werte der abhangigen Variablen Y bei den Untersuchungs- 
personen sind nunmehr drei Indizes notwendig. Der erste Index bezeichnet die Num- 
mer der Person innerhalb einer Bedingungskombination. Der zweite Index gibt die 
Zeile (d.h. die Auspragung des Faktors B), der dritte die Spalte (d.h. die Auspragung 
des Faktors A) an, unter dem diese Person untersucht worden ist. 

Die Mittel werte der abhangigen Variablen sind in den jeweiligen Randspalten und 
-zeilen dargestellt. Die Punkte weisen dabei auf die Indizes hin, tiber die die Auf- 
summierung und Mittelwertsbildung erfolgt. 

Mehrfaktorielle Versuchsplane werden meist mit Hilfe von mehrfaktoriellen Va- 
rianzanalysen ausgewertet. Daflir ist es vorteilhaft, wenn das Design ausbalanciert 
oder orthogonal ist. Dies ist der Fall, wenn die Zahl der Untersuchungseinheiten in 
alien Zeilen gleich ist. 621 

Eingenistete Faktoren 

Werden nicht alle theoretisch moglichen Kombinationen der Auspragungen der 
unabhangigen Variablen auch tatsachlich im Experiment realisiert, spricht man von 
einem (teil -)hierarchischen Versuchsplan und von eingenisteten ( geschachtelten ) 
Faktoren. Der dreifaktorielle Versuchsplan mit einem eingenisteten Faktor in Tabelle 
12.4 ist als Split-plot-Plan bekannt: Jede Auspragung des Faktors C wird einer 

Auspragung des Faktors B untergeordnet und die Untersuchungseinheiten in diesem 
„plot“ werden dann zufallig auf die Auspragungen des anderen Faktors A aufgeteilt 
(„gesplittet“). Dies kann als A x (B x C) symbolisiert werden. 

Ob fur den eingenisteten Faktor ein Haupteffekt besteht, kann nur unter der 
Annahme gepriift werden, dass er nicht mit den anderen Faktoren interagiert. Diese 
Interaktionshypothesen ihrerseits sind in diesem Versuchsplan aber nicht priifbar. 623 

0 Im Experiment zur Gegenkonditionierung der hyperaktiven Kinder soil neben 
„Verstarkungsplan“ (UV A) und „Art der Verstarkung“ (UV B) auch das Studienfach der 
verschiedenen Versuchsleiter (UV C mit den Auspragungen Medizin, Psychologie, 
Padagogik, Betriebswirtschaft, Soziologie und Biologie) untersucht werden. Jeder 



620 

Die mit Indizes versehenen y- und y -Symbole in den bisher vorgestellten Versuchs- 
planen sollen mit der Notation vertraut machen, die in Abhandlungen zur Statistik und 
Versuchsplanung ublich ist. Bei der Darstellung von Versuchsplanen in Diplomarbeiten, 
Publikationen usw. sind diese Symbole entbehrlich, da es vor allem darauf ankommt, 
die unabhangigen Variblen, ihre Modalitaten und Kombinationen in ubersichtlicher 
Form deutlich zu machen (siehe zum Beispiel Tabelle 12.7, Seite 285). 

621 Hager (1987, S. 60-61), Keppel (1991, S. 213-214) 

622 

Diese Bezeichnung stammt aus der ursprlinglichen Anwendung dieser Plane in den 
Agrarwissenschaften (Winer et al., 1991, S. 365-366). 

623 zur Auswertung: Bortz (1999, Kap. 11.1), Winer et al. (1991, Kap. 5.14, 5.15 und 6.6) 





Grundziige der Experimentalmethodik 



275 



Auspragung von B werden zwei Studienfacher zufallig zugeordnet. Zur Prlifung von 
Hypothese Liber die Auswirkung des Studienfachs C muss angenommen werden, dass es 
nicht mit der Art des Verstarkers B interagiert. Die Probanden werden den zwolf 
Bedingungskombinationen zufallig zugeordnet. 

Da die Priifung von Hypothesen iiber eingenistete Faktoren so stark eingeschrankt 
ist, sollte man Faktoren, die hypothesenrelevant und inhaltlich von unmittelbarem 
Interesse sind, nicht einnisten. Eingenistet werden konnen vielmehr vor allem 
Kontrollfaktoren, die stark mit der abhangigen Variablen assoziiert sind und die 
deshalb die Prazision des Experiments erhohen (siehe unten Abschnitt 15.6.2). 
Haufig werden potenziell relevante Merkmale der Untersuchungspersonen als einge- 
nistete Kontrollfaktoren in den Versuchsplan mit aufgenommen. Die Personen mit 
der gleichen Auspragung dieses Faktors bilden dann einen parallelisierten Block und 
werden den Auspragungen der tibrigen Faktoren zufallig zugeordnet ( randomized 
blocks design). 

Tabelle 12.4: Dreifaktorieller Versuchsplan mit einem eingenisteten Faktor 
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0 Bei der Gegenkonditionierung der hyperaktiven Kinder wird neben den unabhangigen 
Variablen „Verstarkungsplan“ und „Art der Verstarkung“ auch die „Herkunft“ der Kinder 
(aus sechs Bundeslandern) berticksichtigt. Die sechs Auspragungen dieses neuen Faktors 
C werden zufallig den drei Auspragungen des Faktors B zugeordnet (siehe wiederum den 
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Versuchsplan in Tabelle 12.4). Den beiden Auspragungen des Faktors A werden die 
Kinder zufallig zugeteilt. 

Besteht jede Auspragung eines Faktors, der in einen experimentellen Faktor 
eingenistet ist, aus genau einer Untersuchungsperson und wird jede Untersuchungs- 
person unter alien Auspragungen des anderen experimentellen Faktoren beobachtet, 
liegt ein Versuchsplan mit wiederholter Messung vor. 

12.2.3 Wiederholte Messungen 

Bisher hatten wir nur die inter-individuelle Variation der experimentellen 
Bedingungen betrachtet: Jede Person wird nur unter einer Auspragung (Modalitat) 
der unabhangigen Variablen bzw. unter einer Kombination der Auspragungen der 
unabhangigen Variablen untersucht (between-subjects design). 

• Bei einer intra-individuellen Bedingungsvariation wird jede Person unter alien 
Auspragungen einer unabhangigen Variablen untersucht ( within-subjects design 
oder repeated-measures design). 624 

Dadurch bilden die Versuchspersonen einen eigenen experimentellen Faktor, der 
auch in den Versuchsplanen explizit dargestellt werden kann und meist mit S (fur 
subjects) bezeichnet wird. 

In einem mehrfaktoriellen Experiment konnen Faktoren mit inter- und intra- 
individueller Bedingungsvariation gemeinsam auftreten ( mixed design). Die Tabelle 
12.5 ist ein zweifaktorieller Versuchsplan, in dem die unabhangige Variable A inter- 
individuell variiert wird, die unabhangige Variable B hingegen intra-individuell. 

Die Zeilen p u bis p ln und p 2 i bis p 2m in Tabelle 12.5 stellen die 
n + m Untersuchungspersonen dar. Wie ein Vergleich mit Tabelle 12.4 deutlich 
macht, bilden die Untersuchungspersonen einen Faktor, der in den experimentellen 
Faktor A eingenistet ist: B x (A x S). Die Personen werden den Auspragungen A! 
und A 2 zufallig zugeordnet und dann alien drei Auspragungen der unabhangigen 
Variablen B ausgesetzt. B wird deshalb auch kurz als wiederholter Faktor be- 
zeichnet. Die Werte der abhangigen Variablen unter diesen drei Auspragungen sind 
wiederholte Messungen 626 



624 

Die Begriffe within-subjects und repeated-measures werden haufig austauschbar ver- 
wendet. Sie sollten aber besser getrennt werden, denn eine wiederholte Messung muss 
nicht mit einer Bedingungsvariation innerhalb der Personen verbunden sein, sie kann 
auch unter gleichen Bedingungen erfolgen (Zeitreihen, siehe unten Seite 278). 

625 Gegeniiber den vorangegangenen Versuchsplanen sind hier Zeilen- und Spaltenfaktor 
vertauscht, um den eingenisteten Faktor in gleicher Weise darstellen zu konnen wie in 
Tabelle 12.4. 

626 

Fur die Auswertung mit Statistikprogrammen mtissen die Werte auf der AV, die die 
gleichen Personen unter verschiedenen Auspragungen einer unabhangigen Variablen 
haben, als unterschiedliche (abhangige) Variablen eingegeben werden. 
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Tabelle 12.5: Zweifaktorieller Versuchsplan mit einem wiederholten Faktor 
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0 Im Experiment zur operanten Gegenkonditionierung der hyperaktiven Kinder sollen die 
beiden unabhangigen Variablen „Verstarkungsplan“ (UV A) und „Art der Verstarkung“ 
(UV B) untersucht werden. Da jedes Kind zu mehreren Sitzungen an aufeinander 
folgenden Tagen kommen muss, besteht eine gute Moglichkeit, die Konditionierung bei 
jedem Kind mit alien Arten von Verstarkungen (Lob, SuBigkeiten und Geld) 
durchzuflihren und danach jeweils die Haufigkeit des hyperkinetischen Verhaltens zu 
erheben. Jedes Kind kann also unter alien drei Auspragungen des Faktors B beobachtet 
werden. Ihre Reihenfolge wird fur jedes Kind zufallig bestimmt. Jedes Kind wird aber 
weiterhin jeweils einer Auspragung des Faktors A zufallig zugeordnet. 

Auf den ersten Blick scheinen intra-individuelle Bedingungsvariationen Vorteile zu 
haben: die einzelnen Personen liefern in ktirzerer Zeit mehr Information, es konnen 
unmittelbar individuelle Veranderungen liber verschiedene Bedingungen untersucht 
werden, auBerdem wird die statistische Auswertung praziser (siehe Kapitel 15.6.2). 

Ein wesentlicher Nachteil der intra-individuellen Bedingungs variation besteht 
darin, dass durch die Abfolge der verschiedenen Bedingungen spezifische Storein- 
fliisse entstehen konnen (siehe unten Kapitel 14.1.1 und 14.3.3). Diese werden 
dadurch zu kontrollieren versucht, dass man die Abfolge der Bedingungen moglichst 
flir jede Person zufallig bestimmt. Oft konnen diese Storungen aber nicht vollstandig 
ausgeglichen werden. Dies fiihrt dazu, dass sich die Wirkungen der verschiedenen 



Die Auswertung kann sowohl liber eine univariate Varianzanalyse flir Messwieder- 
holungen als auch liber eine multivariate Varianzanalyse erfolgen. SPSS fiihrt im Allge- 
meinen linearen Modell beide Arten von Tests durch. Bei der multivariaten Analyse 
werden die Auspragungen des wiederholten Faktors als unterschiedliche abhangige 
Variablen behandelt. Eine univariate Analyse mit mehr als zwei Messungen beruht auf 
speziellen Annahmen zur Homogenitat (genauer: Spharizitat oder Zirkularitat) der 
Varianzen und Kovarianzen (Bortz, 1999, Kap. 9; Hager & Westermann, 1984; Keppel, 
1991, Kap. 15-18; Lewis, 1993). Sind diese Annahmen erfiillt, ist die univariate Analyse 
teststarker, ansonsten in etlichen Fallen der multivariate Test. 
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Bedingungen nicht ausreichend klar trennen lassen. Deshalb ist in der Psychologie 
die intra-individuelle Bedingungsvariation weitaus seltener als die inter-individuelle. 

Ein haufig anzutreffender Spezialfall der intra-individuellen Bedingungsvariation 
ist die Vorher-nachher-Messung : Die abhangige Variable wird nicht nur nach der 
jeweiligen Behandlung untersucht, sondern bei jeder Person auch vorher. Der 
wesentliche Vorteil besteht darin, dass Informationen iiber die individuellen 
Veranderungen durch die experimentelle Behandlung vorliegen. Dem stehen jedoch 
die erwahnten spezifischen Storeinflusse durch die wiederholte Erhebung entgegen. 

Zeitreihen 

Von der intra-individuellen Bedingungsvariation zu unterscheiden ist die mehrfache 
Beobachtung der Personen unter den gleichen experimentellen Bedingungen. Diese 
speziellen Arten der wiederholten Messungen werden haufig als Zeitreihen 
bezeichnet. Mit ihnen wird geprtift, wie die abhangige Variable sich iiber die Zeit 
bzw. iiber mehrere Wiederholungen der gleichen Behandlung verandert. 




Durch eine Zeitreihenmessung wird stets ein Faktor zum Versuchsplan hinzugefiigt. 
Haben wir beispielsweise eine experimentelle unabhangige Variable mit zwei 
Auspragungen A, und A 2 und werden die Personen neunmal untersucht, liegt ein 2 
mal 9- Versuchsplan vor, der in Tabelle 12.6 dargestellt ist. Die Auspragungen T! bis 
T 9 des Faktors T stellen dabei die neun (wiederholten) Messungen dar. 

0 Bei der operanten Gegenkonditionierung hyperkinetischer Kinder wird an neun Tagen 
jeweils eine Unterrichtsstunde mit (kontinuierlicher) Verstarkung ruhiger Verhaltens- 
weisen durchgefiihrt (Bedingung A 2 ). Fur jede Stunde und jedes Kind wird die Haufigkeit 
hyperkinetischer Verhaltensweisen ermittelt. Ein Abfall iiber die ersten neun Tage zeigt, 
dass das storende Verhalten tatsachlich operant kontrolliert werden kann. Dass die 
Verringerung der hyperkinetischen Verhaltensweisen tatsachlich auf die Verstarkung 
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zuriickzufuhren ist, wird durch Vergleich mit der Kontrollbedingung Aj gepriift, bei der 
es keine systematischen Verstarkungen gibt, aber alle anderen Bedingungen gleich sind. 

0 In ahnlicher Weise durch Messwiederholung untersucht werden kann die Verkurzung der 
Bearbeitungszeit bei aufeinander folgenden Ubungsdurchgangen zur Formulierung 
mathematischer Beweise, der Abfall des Adaptationsniveaus in Abhangigkeit von der 
Zeit in der Dunkelheit oder die Steigerung der Anstrengung bei Bearbeitung gleichartiger 
Aufgaben mit zunehmender Schwierigkeit. 

Das Prinzip der wiederholten Messung der abhangigen Variablen unter den gleichen 

Bedingungen kann natiirlich auch auf Falle mit zwei oder mehr experimentellen 

Faktoren verallgemeinert werden. 

0 Im Experiment zur Gegenkonditionierung hyperaktiver Kinder hatten wir zwei voll- 
standig gekreuzte UV, eine eingenistete UV und insgesamt zwolf Bedingungskombina- 
tionen (Tabelle 12.4). Fur jede der ihnen zugewiesenen Untersuchungspersonen kann die 
Haufigkeit hyperaktiver Verhaltensweisen z.B. zwanzig Mai erhoben werden. 



12.3 Komponenten experimenteller Untersuchungen 

Ganz allgemein gesagt, ist der Ausgangspunkt einer wissenschaftlichen Forschungs- 
arbeit eine Frage- oder Problemstellung, und das Ziel besteht darin, die Ausgangs- 
frage besser zu beantworten, das Ausgangsproblem besser losen zu konnen. Dazu 
werden systematisch Erfahrungen gesammelt und ausgewertet. Dabei konnen 
verschiedenartige Untersuchungsarten (Experiment, Quasi-Experiment usw.) und 
Erhebungsmethoden (Beobachtungen, Testungen, physiologische Messungen usw.) 
eingesetzt werden (siehe Kapitel 1.3). Dementsprechend unterschiedlich sind auch 
die konkreten Ablaufe und Vorgehensweisen in psychologischen Forschungs- 
arbeiten. Es gibt aber dennoch etliche Arbeitsschritte und Ablaufe, die fast immer zu 
einer adaquaten empirisch-psychologischen Forschungsarbeit gehoren. Eingeteilt 
werden diese Hauptkomponenten einer empirischen Forschungsarbeit in vier Phasen: 

1. Theorie, 

2. Methode, 

3. Ergebnisse und 

4. Diskussion. 

Es hat sich eingebtirgert, diese Begriffe als Gliederungspunkte in wissenschaftlichen 
Veroffentlichungen von empirischen Forschungsergebnissen zu verwenden. 627 



62V 

Richtlinien fur empirische Arbeiten in Fachzeitschriften wurden von der American 
Psychological Association (1994) und der Deutschen Gesellschaft fiir Psychologic 
(1997) herausgegeben. Fiir die Durchftihrung und Presentation statistischer Auswertun- 
gen liegen auch verbesserte Empfehlungen vor (Wilkinson & the Task Force on 
Statistical Inference, 1999). Weitere Hinweise fiir die Gestaltung von Untersuchungs- 





280 



Kapitel 12 



Die vier Phasen sind unter anderem dadurch charakterisiert, dass unterschiedliche 
Arten von Fragestellungen und Hypothesen aufgestellt bzw. gepriift werden. 

• Die theoretische Arbeit geht von allgemeinen Fragestellungen aus und miindet 
(explizit oder implizit) in spezifische wissenschaftliche Hypothesen. 

• Die methodischen Entscheidungen und Festlegungen ftihren dazu, dass eine 
konkrete Anwendungssituation und damit eine bestimmte empirische Hypothese 
spezifiziert wird. Aus ihr konnen konkrete empirische Vorhersagen abgeleitet 
werden. 

• Die Auswertung der Ergebnisse erfolgt in der Regel tiber Signifikanztests, die 
bestimmte statistische Hypothesen priifen. 

• In der abschlieBenden Diskussion werden die Ergebnisse der statistischen 
Hypothesenprlifung verwendet, um Entscheidungen liber die empirischen und 
wissenschaftlichen Hypothesen zu treffen. 

Diese verschiedenen Arten von Hypothesen liegen auf unterschiedlichen Ebenen, 
miissen aber systematisch und eindeutig miteinander verbunden werden, damit wir 
auf der Basis der empirischen Daten liber sie entscheiden konnen. Wichtig ist vor 
allem die Unterscheidung und die Verbindung zwischen den wissenschaftlichen 
Hypothesen, die den uns interessierenden inhaltlichen Fragestellungen und 
Vermutungen entsprechen, einerseits und den statistischen Hypothesen andererseits, 
die in (fast) alien wissenschaftlichen Untersuchungen tatsachlich gepriift werden. 

Die verschiedenen Phasen und Hypothesen einer wissenschaftlichen Untersu- 
chung werden im Folgenden beschrieben und am Beispiel des Experimentes von 
Frey und Irle illustriert. Etliche Bestandteile dieses Untersuchungsprozesses sind so 
vielschichtig und wichtig, dass sie zunachst nur angerissen werden konnen und in 
spateren Kapiteln noch ausfiihrlich dargestellt werden. 

12.3.1 Theorieteil: wissenschaftliche Fragestellungen und Hypothesen 

Im Theorieteil wird zunachst die allgemeine Frage- oder Problemstellung 
beschrieben. Diese Forschungsfragestellung kann sich zum einen primar auf einen 
bestimmten Sachverhalt und seine Ursachen oder Folgen beziehen (problem - 
orientiertes Forschungsprogramm). Zum anderen kann sie primar auf eine 
bestimmte Theorie und ihre Ausgestaltung oder Gtiltigkeit gerichtet sein ( theorie - 
orientiertes Forschungsprogramm). Beide Sichtweisen konnen nattirlich auch in 
verschiedener Weise kombiniert sein. 628 

0 Frey und Irle beschaftigen sich allgemein mit der Beziehung zwischen Belohnung und 

629 

Meinungsunterschied nach einstellungskontrarem Verhalten. Primar fuhren sie ihr 



ablaufen und -berichten: Hager (1987), Hager & Spies (1991), Lewin (1986), Huber 
(1995, Kap. 4), Traxel (1974). 

628 siehe oben Kapitel 9.3.3 

629 Frey & Irle (1972) 





Grundziige der Experimentalmethodik 



281 



Experiment aber durch, um eine bestimmte modifizierte Version der Dissonanztheorie 
empirisch zu iiberpriifen, nach der Dissonanz nur entsteht, wenn das Selbstkonzept 
tangiert oder bedroht ist (siehe Kapitel 1 1.4.3). 

Jede wissenschaftliche Arbeit muss auf einer umfassenden Sichtung, Zusammen- 
fassung und Analyse der bereits vorhandenen Fachliteratur beruhen. Aus diesen 
Vorarbeiten ergeben sich begriffliche Prazisierungen und Systematisierungen, 
empirische Befunde und mogliche theoretische Erklarungen. 

0 Frey und Irle beziehen sich auf das paradigmatische Experiment von Festinger und 
Carlsmith, in der die dissonanztheoretische Hypothese bestatigt wurde, dass die 
Meinungsanderung (als Manifestation des Reduktionsdrucks) bei einer groBen Belohnung 
fur einstellungskontrares Verhalten (also geringer Dissonanzstarke) kleiner ist als bei 
geringen Belohnungen. 631 Sie beriicksichtigen aber auch, dass diese Befunde keineswegs 
in alien nachfolgenden Untersuchungen bestatigt worden sind. Vielmehr hat sich auch die 
verstarkungstheoretisch zu erwartende positive Beziehung gezeigt. Deshalb beziehen 
Frey und Irle sich auf Aronsons Theoriemodifikation, nach der Dissonanz nur erzeugt 
wird, wenn das Selbstkonzept tangiert oder bedroht ist. 

Wissenschaftliche Hypothesen 

Die Analyse der vorliegenden Theorien, Hypothesen und Forschungsbefunde fiihrt in 
der Regel zu praziseren Forschungsfragestellungen, vor allem aber zu begrtindeten 
Vermutungen fiber die zu erwartenden Ergebnisse. 

0 Frey und Irle erwarten, dass bei einem selbstkonzepttangierenden, einstellungskontraren 
Verhalten Dissonanz auftritt und dass die tatsachliche Einstellung umso starker in 
Richtung auf die ausgedrtickte Meinung verandert wird, je kleiner die Belohnung ist. 
Wird das Selbstkonzept durch ein einstellungsdiskrepantes Verhalten nicht bedroht, tritt 
keine Dissonanz auf, und die tatsachliche Meinung wird um so starker in Richtung auf 
die ausgedrtickte Meinung verandert, je groBer die Belohnung ist. 

Eine derartige vermutete oder erwartete Antwort auf eine Forschungsfragestellung 
bezeichnet man als Forschungshypothese, als wissenschaftliche Hypothese oder 
speziell fur unser Fach als psychologische Hypothese. 

Wissenschaftliche Hypothesen sind Aussagen, die sich auf substanzwissen- 
schaftliche Konstrukte, Begriffe, Merkmale oder Variablen beziehen. Zu ihnen 
gehoren alle Arten von Aussagen dartiber, dass bestimmte Gesetzesannahmen, 
Zusammenhangsvermutungen, Modellvorstellungen, theoretische Erklarungen, 
vorlaufige Problemlosungen usw. (fur bestimmte Arten von Situationen und 



630 

Zur Fachliteratur gehoren einschlagige Lehrbucher, Monographien, Beitrage in 
Sammelbanden und Kongressberichten sowie Ubersichtsartikel und Darstellungen 
empirischer Untersuchungen in Zeitschriften. Das Auffinden relevanter Arbeiten wird 
durch Datenbanken (vor allem PSYNDEX und PSYCHINFO) erheblich erleichtert, die liber 
die Universitatsbibliotheken zuganglich sind. 

631 Festinger & Carlsmith (1959), Kritik: Chapanis & Chapanis (1964) 
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Personen) zutreffend sind. Sie diirfen nicht mit den statistischen Hypothesen 
gleichgesetzt werden, die durch Signifikanztests gepriift werden. 632 

In einer strukturalistischen Rekonstruktion entspricht eine wissenschaftliche 
Hypothese einer empirischen Behauptung fur ein bestimmtes Theorie-Element: Die 
spezifizierten Variablenzusammenhange sollen in alien intendierten Anwendungs- 
fallen tatsachlich gelten. Diese intendierten Anwendungsmengen sind per 
definitionem unabgeschlossen und nur grob abgegrenzt (siehe oben Kapitel 1 1.8). 

Wissenschaftliche Hypothesen konnen sich dahingehend unterscheiden, wie 
abstrakt oder empirienah sie sind, wie prazise und wie komplex sie sind, ob sie auf 
eine umfangreiche Theorie bezogen sind oder nicht, wie groB der Geltungsanspruch 
ist, wie sehr sie durch vorliegende wissenschaftliche Erkenntnisse gestlitzt sind usf. 

In manchen Forschungsberichten sind die wissenschaftlichen Hypothesen explizit 
formuliert. In anderen Fallen hingegen lassen sich die wissenschaftlichen 
Hypothesen, die der empirischen Forschung zugrunde liegen, nur mehr oder minder 
eindeutig und vollstandig rekonstruieren. 

In problem-orientierten Forschungsarbeiten sind die wissenschaftlichen Hypothe- 
sen oft nicht abstrahiert und theoriebezogen, sondern direkt auf beobachtbare Sach- 
verhalte bezogen. 

0 „Komplexe sprachliche Ausdriicke in der Gebardensprache gelingen Personen, die diese 
seit der friihen Kindheit verwenden, besser als Personen, die die Gebardensprache erst im 
Erwachsenenalter erlernt haben.“ 634 

0 „Die rezeptiven Felder der Thalamusneurone sind um so kleiner, je weiter distal sie auf 
den Extremitaten liegen.“ 635 

AuBerdem sind Hypothesen in problem-orientierten Forschungsprogrammen oft sehr 
unspezifisch, die Untersuchungen sind dementsprechend eher explorativ. 

0 Ost- und Westdeutsche unterscheiden sich in ihren politischen Einstellungen. 

0 Die Auswirkungen von Arbeitslosigkeit hangen von der familiaren Unterstiitzung und 
den individuellen Bewaltigungsstrategien ab. 

Untersuchungen in theorie-orientierten Forschungsprogrammen sind meist auf 
spezifische wissenschaftliche Hypothesen ausgerichtet und primar hypothesen- 
prufend. Untersucht werden konnen sowohl Kausalhypothesen als auch 
Assoziationshypothesen (siehe oben Kapitel 7.2.7). 



632 

633 



634 

635 



Bolles (1962), Bredenkamp (1972, 1980), Meehl (1967, 1986), Westermann & Hager 
(1982), Hager (1992b, S. 11), Chow (1996), siehe Kapitel 12.3.3 und 15 bis 17 
Bezieht sich die wissenschaftliche Hypothese auf eine komplexere Theorie, entspricht 
sie einer empirischen Behauptung, die mit einer ganzen Reihe von Theorie-Elementen 
verbunden ist. Auch wenn eine Forschungshypothese eher eine informelle Vermutung 
und nicht an eine Theorie gebunden ist, konnen die ihr zugrunde liegenden Konzepte 
und Annahmen durch ein Theorie-Element rekonstruiert werden. 

Zimbardo & Gerrig (1999, S. 483) 

Birbaumer & Schmidt (1999, S. 314) 
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12.3.2 Methodenteil: empirische Vorgehensweisen und Erwartungen 

Wie im vorigen Kapitel deutlich wurde, sind psychologische Hypothesen noch zu 
allgemein, um vollstandig empirisch iiberpruft zu werden. Psychologische 
Hypothesen sind nur exemplarisch iiberprufbar, das heiBt jeweils nur fur ganz 
bestimmte Anwendungsfalle. 

Jeder Anwendungsfall einer psychologischen Hypothese umfasst bestimmte 
situationale Bedingungen, bestimmte Personen sowie bestimmte Methoden zur 
Auslosung bzw. Erhebung der interessierenden Sachverhalte. Im Methodenteil eines 
empirischen Untersuchungsberichtes werden die wesentlichen Merkmale der 

/TO /T 

betrachteten Anwendungssituation dargestellt und begrlindet. 

12.3.2.1 Festlegung der Untersuchungsart 

Bei der Planung einer empirischen Untersuchung muss zunachst die 
Untersuchungsart festgelegt werden. Wichtig ist insbesondere, ob die psycholo- 
gische Hypothese experimentell gepriift werden kann oder ob nur eine quasi-ex- 
perimentelle oder eine korrelative Untersuchung moglich ist. AuBerdem kann man 
sich mitunter entscheiden, ob die Untersuchung unter kiinstlichen oder natiirlichen 
Bedingungen, das heiBt „im Labor“ oder „im Feld“ durchgefuhrt werden soil. Zur 
Priifung von Kausalhypothesen sind Experimente (im Labor und Feld) am besten 
geeignet (siehe Kapitel 14.3). 

0 Frey und Irle fiihren ihr Experiment in einer relativ natiirlichen, namlich unterrichts- 
ahnlichen Situation durch. 

12.3.2.2 Festlegung und Operationalisierung der Variablen 

Die zu untersuchenden Sachverhalte mtissen so weit konkretisiert werden, dass sie 
eindeutig hervorgerufen bzw. beobachtet werden konnen. 

0 Um einstellungskontrares Verhalten untersuchen zu konnen, lieBen Frey und Irle 
Mannheimer Gymnasiasten Aufsatze gegen die Senkung des Wahlalters schreiben. Die 
wenigen Schuler, die vor dem Experiment eine negative Meinung liber die Senkung 
auBerten, wurden nicht mit in die Auswertung einbezogen. 

Die Wahl der in der Untersuchung zu betrachtenden Variablen wird unmittelbar 
durch die psychologische Hypothese bestimmt. Bei Assoziationshypothesen sind alle 
Variablen gleichberechtigt. Bei der Priifung von Kausalhypothesen entsprechen die 
unabhangigen Variablen im Experiment den vermuteten Ursachen, die abhangigen 
Variablen den vermuteten Wirkungen. 



636 

Ein Merkmal der Untersuchungssituation ist unwesentlich, wenn es das Ergebnis der 
Untersuchung nicht beeinflusst. Beispielsweise mogen Alter und Geschlecht der 
Versuchsleiter in einem psychophysischen Experiment unwesentlich sein, wahrend sie 
das Ergebnis eines Experimentes zur Einstellungsanderung beeinflussen konnen. 
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0 Frey und Irle betrachten als abhangige Variable die Meinung ihrer Personen zur Senkung 
des Wahlalters. Zur Prlifung ihrer wissenschaftlichen Hypothese sind zwei unabhangige 
Variablen notwendig: 

- die Belohnung fiir das einstellungsdiskrepante Verhalten und 

- das AusmaB, in dem das Selbstkonzept durch Offentlichkeit oder Entscheidungs- 
freiheit tangiert ist. 

0 Frey und Irle nahmen an, dass das Selbstkonzept durch dieses einstellungskontrare 
Verhalten nicht bedroht wird, wenn die Person keine Moglichkeit hatte, dieses Verhalten 
zu vermeiden oder wenn dieses Verhalten vollstandig anonym ist. Wenn aber eine 
Entscheidungsmoglichkeit bestand, sollte das Selbst betroffen sein, insbesondere wenn 
das Verhalten offentlich ist und negative Sanktionen beftirchtet werden mussen. 

Intensiv uberlegt und gepriift werden muss, welche weiteren Variablen das Ergebnis 
unter den gegebenen Umstanden mit beeinflussen oder gar deutlich verfalschen 
konnen. Auf dieser Basis muss festgelegt werden, welche potenziellen Storvariablen 
konstant gehalten, eliminiert, randomisiert oder auf eine andere Weise kontrolliert 
werden sollen (siehe unten Kapitel 14). Die ubrigen Merkmale der untersuchten 
Personen und Situationen bleiben (zumindest zunachst) unberiicksichtigt. 

0 Konstant gehalten und damit explizit kontrolliert haben Frey und Irle die wichtigsten 
Merkmale der Untersuchungsdurchfuhrung: Instruktionen, Durchfuhrungszeiten usw. 
Miterfasst wurden die anfanglichen Meinungen der Schuler. 

Falls die spezifizierten unabhangigen oder abhangigen Variablen noch nicht direkt 
beobachtbar sind, mussen ihnen konkrete, direkt beobachtbare GroBen oder 
Erhebungsmethoden zugeordnet werden ( Operationalisierung ). 

0 Die Einstellung zur Senkung des Wahlalters wurde von Frey und Irle durch 
Selbsteinschatzung der Personen auf einer elfstufigen graphischen Skala erhoben, die von 
-5 („stark gegen die Herabsetzung 44 ) liber 0 („unentschieden 44 ) bis +5 („stark fiir die 
Herabsetzung 44 ) reichte. 

0 Die unabhangige Variable Belohnung wurde in zwei Auspragungen realisiert, indem der 
einen Gruppe von Personen 1 DM, der anderen 8 DM versprochen wurde. 

0 Fiir die zweite unabhangige Variable (Tangierung des Selbstkonzepts) wurden ebenfalls 
zwei Auspragungen festgelegt: Der einen Halfte der Personen wurde gesagt, dass sie die 
freie Entscheidung haben, an dem Versuch teilzunehmen, und dass sie ihren Aufsatz 
namentlich kennzeichnen und offentlich verteidigen mussen. Diese Auspragung 
bezeichnen wir mit EO+. Es wird angenommen, dass hier das Selbstkonzept tangiert ist 
und Dissonanz auftritt. Der anderen Gruppe wurde kein expliziter Hinweis auf eine 
Entscheidungsfreiheit gegeben, und der Aufsatz sollte anonym bleiben (EO-). Hier soil 
das Selbstkonzept nicht tangiert sein und keine Dissonanz auftreten, sondern das Prinzip 

63 V 

der operanten Verstarkung gelten. 



637 Die unabhangige Variable hatte noch zwei weitere, mittelstarke Auspragungen (mit 
Entscheidungsfreiheit, aber ohne Offentlichkeit sowie ohne Entscheidungsfreiheit, aber 
mit Offentlichkeit). AuBerdem wurde noch eine Kontrollgruppe ohne Hin weise auf 
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Bei der Festlegung der genauen Umstande der empirischen Anwendungs- oder 
Priifsituationen und insbesondere bei der Operationalisierung der Variablen hat man 
meist die Wahl zwischen zwei oder mehr unterschiedlichen Moglichkeiten. 

0 Die Einstellung zur Senkung des Wahlalters kann durch Verhaltensbeobachtung oder 
durch Skalierang erhoben werden. Die Skalierung kann durch Antworten auf einer 
bipolaren Skala erfolgen, aber auch durch Aufsummierung der Antworten zu mehreren 
Fragen. Diese Fragen wiederum konnen allgemein-bewertend sein (wie beim 
semantischen Differential) oder einzelne Uberzeugungen ausdrticken. Die Aussagen liber 

einzelne Uberzeugungen wiederum konnen nach der hochsten Trennscharfe (. Likert - 

638 

Skala ) oder nach Expertenurteilen ( Thurstone-Skala ) ausgewahlt werden. 

Unabhangig davon, wie die Spezifikation von Anwendungssituationen und Operatio- 

nalisierungen ausfallt: Die getroffenen Entscheidungen miissen im Methodenteil 

beschrieben und begrlindet werden, damit sie von anderen Wissen-schaftlern nach- 

vollzogen und akzeptiert oder kritisiert werden konnen. Die Begriindungen konnen 

• • 

sich sowohl auf theoretische Uberlegungen wie auf empirische Ergebnisse stutzen. 

0 Die Messung von Einstellungen mit Likert-Skalen ist gut mit Fishbeins Theorie der 

639 

Einstellung vertraglich. 

Haufig erfolgt die Wahl von Anwendungssituation und Operationalisierung auch in 
Anlehnung an paradigmatische oder andere erfolgreiche Anwendungen. 640 

12.3.2.3 Versuchsplan und -ablauf 

Aus den unabhangigen Variablen und ihren Operationalisierungen ergibt sich der 
Versuchsplan der Untersuchung. 

0 Im Experiment von Frey und Me werden die beiden unabhangigen Variablen vollstandig 
gekreuzt, d.h. es werden alle moglichen Bedingungen realisiert, die durch Kombination 
der beiden Faktoren entstehen. Der von uns hier betrachtete Teil des Experiments 
entspricht einem 2x2- Versuchsplan (Tabelle 12.7). Die Personen werden den vier 
Bedingungskombinationen zufallig zugewiesen. 

Tabelle 12.7: Versuchsplan flir das Experiment von Frey und Me (vereinfacht) 



Entscheidungsfreiheit und 


Belohnung 




Offentlichkeit 


1 DM 


8 DM 


ja (EO+) 


<1,1> 


<1,2) 


nein (EO-) 


(2,1) 


<2, 2) 



Belohnung und Entscheidungsfreiheit bzw. Offentlichkeit untersucht. Diese 
Experimentalgruppen sollen der Einfachheit halber unberlicksichtigt bleiben. 

638 zu den Methoden: Bortz & Doring (1995), Roth (1984), Sixtl (1982) 

639 Fishbein & Ajzen (1975), Westermann (1982, 1983a) 

640 siehe oben Kapitel 9.3.2 
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Entsprechend den bisherigen Festlegungen ist der konkrete Ablauf der einzelnen 
Untersuchungen der Personen in den unterschiedlichen Bedingungskombinationen 
festzulegen und zu beschreiben. Dazu gehoren unter anderem die Rekrutierung der 
Versuchspersonen, die Schulung der Versuchsleiter, der apparative Aufbau des 
Versuchs und die Instruktion der Untersuchungspersonen und ihre spatere 
Aufklarung liber den Zweck der Untersuchung. 

12.3.2.4 Empirische Hypothesen und empirische Vorhersagen 

Durch die im Methodenteil einer Untersuchung getroffenen Festlegungen wird eine 
mogliche Anwendungssituation fur die psychologische Hypothese spezifiziert. Sie 
kann als Partialmodell eines empirienahen Theorie-Elementes beschrieben werden, 
das zur Menge der noch zweifelhaften Anwendungen gehort. Aufgrund der 
Ergebnisse dieser Untersuchung soil die empirische Hypothese geprlift werden, dass 
diese zweifelhafte Anwendung tatsachlich eine erfolgreiche Anwendung ist, d.h. 
dass die angenommenen Variablenzusammenhange in der betrachteten Situation 
gelten. 642 

Unter der Annahme, dass die empirische Hypothese zutreffend ist, konnen 
Vorhersagen iiber die empirischen Ergebnisse getroffen werden. Diese begriindeten 
Erwartungen bezeichnen wir als empirische Vorhersagen. Sie beziehen sich in der 
Regel nicht auf einzelne Versuchspersonen, sondern auf Ergebnisse in ganzen 
Gruppen. In der psychologischen Forschung werden meist arithmetische Mittelwerte 
betrachtet und empirische Vorhersagen liber ihre GroBenordnung getatigt. 

0 Im Experiment von Frey und Irle werden fur die Bedingungen mit und ohne Tangierung 
des Selbstkonzepts (EO+ bzw. EO-) aus der Dissonanz- bzw. der Verstarkungstheorie 
Meinungsanderungen in unterschiedlicher Richtung vorhergesagt: 

- In der Bedingung EO+ findet bei 1 DM Belohnung eine groBere Meinungsanderung 
statt als bei 8 DM Belohnung (Dissonanzeffekt). Deshalb ist unter 1 DM ein 
geringerer Meinungswert als unter 8 DM zu erwarten. Wir erwarten also, dass die Y- 
Variable in der Bedingung (1,1) tendenziell kleiner ist als in der Bedingung (1,2). 
Betrachten wir arithmetische Mittelwerte, erhalten wir folgende empirische Vorher- 
sage: 

(12-1) Yn < y 12 - 

- In der Bedingung EO— findet bei 1 DM eine kleinere Meinungsanderung statt als bei 8 
DM (Verstarkungseffekt). Deshalb ist unter 1 DM ein hoherer mittlerer Meinungswert 
als unter 8 DM zu erwarten. Daraus ergibt sich die empirische Vorhersage 

(12-2) y 2 i>y 2 2- 



zur konkreten Formulierung von Instruktionen: Ltier (1987), Huber (1995, S. 124-128); 
zur Aufklarung von Personen und anderen ethischen Problemen: Lenk (1979), Schuler 
(1980), Lewin (1986, S. 21-33), Rehm & Strack (1994, Kap. 6), Huber (1995, Kap. 9) 
zur genaueren Definition empirischer Hypothesen siehe oben Kapitel 11.8.1 
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Wenn wir davon sprechen, dass Vorhersagen iiber empirische Beobachtungen von 
psychologischen (oder empirischen) Hypothesen abgeleitet, deduziert oder impliziert 
werden, ist das nur in einem approximativen Sinn gemeint. Empirische Vorhersagen 
ergeben sich aus den empirischen Hypothesen nur dann logisch zwingend, wenn 
zusatzliche Annahmen gemacht werden (siehe unten Kapitel 16.1). Vor allem 
miissen die Variablenvaliditat (Kapitel 13.5) und die interne Validitat (Kapitel 14) 
des Experiments ausreichend hoch sein. 

12.3.2.5 Testplanung 

Die Auswertung erfolgt in der Psychologie in aller Regel mit Hilfe von 

Signifikanztests . Die Tests miissen so ausgewahlt werden, dass moglichst eindeutig 

• • 

gepriift werden kann, ob die Ubereinstimmungen bzw. die Abweichungen, die 
zwischen Daten und Vorhersagen bestehen, als zufallig oder als systematisch zu 
betrachten sind. 

0 Frey und Irle verwenden zwei F-Tests, die zwei Hypothesen priifen, die sich auf Mittel- 

643 

oder Erwartungswerte in den Populationen beziehen: Li = li : und u : = p 22 . 

Die Personenzahl in jeder der Bedingungskombinationen muss so gewahlt werden, 
dass bei den eingesetzten Signifikanztests nicht nur die Wahrscheinlichkeit fiir einen 
Fehler 1. Art (das Signifikanzniveau a), sondern auch die Wahrscheinlichkeit (3 fiir 
einen Fehler 2. Art ausreichend klein ist (siehe im einzelnen Kapitel 15.5). In den 
meisten empirischen Arbeiten wird jedoch eine derartige Testplanung nicht 
durchgeflihrt. Dies hat haufig zur Folge, dass die Fallzahl zu klein ist, um 
Mittel wertsunterschiede als signifikant aufzuweisen. 

0 Frey und Irle untersuchen in jeder der vier Bedingungskombinationen 16 Personen, haben 
diese Zahl jedoch ohne systematische Testplanung festgelegt. 

12.3.3 Ergebnisteil: statistische Hypothesen und Tests 

Wenn die Untersuchung durchgefuhrt und die Werte der Personen auf den 
interessierenden Variablen erhoben worden sind, werden die Daten ausgewertet und 
die wichtigsten Ergebnisse beschrieben. Betrachtet werden sollten dabei in erster 
Linie immer diejenigen Ergebnisse, die zur Entscheidung iiber die empirischen 
Hypothesen notwendig sind. 

Als erstes sollten stets die Rohdaten inspiziert werden, vor allem die Haufigkeits- 
verteilungen der abhangigen Variablen in den einzelnen Bedingungen bzw. die 
Streudiagramme korrelierender Variablen. 644 Auf diese Weise konnen unwahr- 
scheinliche oder unmogliche Werte entdeckt werden, die durch Fehler bei der 
Erhebung oder Eingabe der Daten entstanden sind. 



643 Eine eindeutigere Priifung erfolgt durch gerichtete t-Tests (siehe unten Kapitel 16.2). 

644 In SPSS sind im Menu Graphiken z.B. Histogramme und Streudiagramme zu erzeugen. 
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Stets sollte man bei der Dateninspektion auf besondere Merkmale der Ver- 
teilungen achten, die die Ergebnisse und ihre Interpretation drastisch beeinflussen 
konnen. Dazu gehoren sehr schiefe oder ausgepragt zweigipfelige Verteilungen 
sowie sehr extreme Variablenauspragungen („ AusreiBer"). Sie flihren dazu, dass das 
arithmetische Mittel nicht im Bereich der haufigsten Werte liegt, also die zentrale 
Tendenz der Daten nicht so eindeutig charakterisiert wie bei symmetrischen und 
unimodalen Verteilungen. AuBerdem konnen Korrelationen und Mittelwerts- 
vergleiche schon durch einen AusreiBer ganz drastisch verandert werden. 645 

Falle mit AusreiBerwerten konnen von der Datenauswertung ausgeschlossen 
werden, insbesondere natiirlich wenn der begrlindete Verdacht besteht, dass sie z.B. 
auf Fehler bei der Reizprasentation, der Antwortregistrierung oder der Instruktion 
zuriickzufuhren sind. Man darf dabei aber natiirlich die Daten nicht bewusst so 
verandern, dass das gewiinschte Ergebnis eher eintritt. 

Deskriptive Statistiken (Mittelwerte, Varianzen, Korrelationen, usw.) geben einen 
ersten zusammenfassenden Eindruck von den empirischen Ergebnissen. Sie konnen 
numerisch genau in Tabellen oder anschaulicher in Graphiken dargestellt werden. 

0 In Tabelle 12.8 sind die Mittelwerte der Meinungsangaben in den vier Experimental- 
bedingungen von Frey und Irle aufgefiihrt. Sie entsprechen den beiden empirischen 
Vorhersagen. 

Tabelle 12.8: Experiment von Frey und Irle: Meinungsmittelwerte 



Entscheidungsfreiheit und 




Belohnung 




Offentlichkeit 


1 DM 




8 DM 


EO+ 


0,06 




2,56 


EO- 


3,75 




1,94 



In der groBen Mehrheit der empirischen Untersuchungen in der Psychologie werden 
zur Auswertung der Daten Signifikanztests (vor allem t- und F-Tests) verwendet. 
Erweist sich ein empirisches Ergebnis (z.B. ein Unterschied zwischen zwei Gruppen- 
mittelwerten) als signifikant, wird es in der Regel als systematisch und „statistisch 
abgesichert“ betrachtet, ansonsten als zufallig. 

0 Frey und Irle haben in den Auspragungen EO+ und EO- empirische F-Werte von 4,32 
bzw. 4,93 erhalten, die fur die Fehlerwahrscheinlichkeit a = 0,05 beide signifikant sind. 
Die vorhergesagten Mittelwertsordnungen y 12 >y u und y 2 i>y 22 werden deshalb als 
systematisch interpretiert. 



645 Bortz (1999, S. 206-207). Als AusreiBer betrachtet werden konnen z.B. Variablen- 
auspragungen, die mehr als drei Standardabweichungen vom Mittelwert entfernt liegen 
(Stevens, 1990, S. 11-15). 

646 Diese ubliche Interpretation ist zu undifferenziert, da sie EffektgroBe und Teststarke 
nicht berticksichtigt (siehe unten Kapitel 15 bis 17). 
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Mit Signifikanztests konnen statistische Hypothesen gepriift werden. Das sind 
Annahmen oder Behauptungen iiber Verteilungen oder Parameter von Zufalls- 
variablen in Populationen. Einige Beispiele fur statistische Hypothesen: 



- Pi<P 2 

- = p 2 = P3 = P4 

- p = 0 

- Bi<B 2 <IU 



Alternativhypothese: einseitiger t-Test fur Mittelwerte 
Nullhypothese: Varianzanalyse fur vier Gruppen 
Nullhypothese: t-Test fur Korrelationskoeffizient 
Hypothese: ordinaler Trend bei drei Mittelwerten. 



In empirischen Untersuchungen werden derartige statistische Hypothesen gepriift, 
um iiber die eigentlich interessierenden empirischen und wissenschaftlichen 
Hypothesen zu entscheiden. Deshalb miissen statistische Tests so ausgewahlt 
werden, dass ihre moglichen Ausgange eindeutig und sinnvoll auf die moglichen 
Entscheidungen iiber die empirische Hypothese abgebildet werden konnen (siehe 
Kapitel 16). 

Um die GroBe der empirischen Unterschiede auszudriicken, miissen Effektgrofien 
berechnet werden: standardisierte Mittelwertsdifferenzen, Korrelationskoeffizienten 
oder Varianzanteile (siehe Kapitel 15.4). In empirischen Arbeiten wird dies haufig 
unterlassen. Dies kann zum einen zur Folge haben, dass kleine, wegen einer groBen 
Untersuchungsgruppe aber signifikante Effekte falschlicherweise als bedeutsam 
interpretiert werden. Zum anderen werden haufig bedeutsame Effekte nicht beachtet, 
weil sie (wegen zu kleiner Untersuchungsgruppe) insignifikant geblieben sind. 

0 Frey und Irle teilen keine EffektgroBen mit, die beiden hier interessierenden Effekte sind 

648 

aber (wie eine nachtragliche Berechnung zeigt) relativ groB. 

tiber die gezielte Priifung der Hypothesen und Vorhersagen hinaus konnen noch 
weitere interessierende Aspekte der empirischen Ergebnisse beschrieben und 
analysiert werden. Dabei konnen zum einen weitere, nicht so zentrale Hypothesen 
gepriift werden. Zum anderen kann eine Dateninspektion zu mannigfaltigen 
Erkenntnissen fiihren, die fur die Interpretation der Ergebnisse oder die weitere 
Forschung anregend sein konnen. 



12.3.4 Diskussionsteil: von statistischen zu wissenschaftlichen Aussagen 

Im Diskussionsteil eines Untersuchungsberichtes werden die wesentlichen 
empirischen Ergebnisse zusammengefasst und interpretiert. Dabei wird auch erortert, 
ob sie durch Storvariablen oder Durchfiihrungsfehler beeinflusst worden sind. 



647 Mit u werden Populationsmittelwerte bezeichnet, mit p die Korrelationskoeffizienten in 
der Population. Die letzte statistische Hypothese kann nicht direkt durch einen 
Signifikanztest iiberpruft werden (siehe unten Kapitel 16.4). 

648 Die Mittelwertsunterschiede entsprechen Korrelationen von 0,34 bzw. 0,38. Dies sind 
nach Cohen (1988, S. 26) bereits groBe Effekte (siehe Kapitel 15.4.3). 
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0 Im Experiment von Frey und Irle entsprechen die empirischen Mittelwertsrelationen den 
empirischen Vorhersagen, und die Mittelwertsunterschiede sind groB und signifikant. 

Auf dieser Basis kann eine Entscheidung iiber die empirischen Hypothesen getroffen 
werden. Damit wird auch ein Beitrag zur Bewertung der wissenschaftlichen 
Hypothese und zur Beantwortung der Ausgangsfragestellung geleistet. 

0 Die empirische Hypothese kann eindeutig akzeptiert werden. Frey und Irles 
psychologische Hypothese, dass das Selbstkonzept tangiert sein muss, damit Dissonanz 
entsteht, hat damit eine empirische Bestatigung gefunden. 

Manche Untersuchungen sprechen durchgangig fur oder gegen die Gtiltigkeit der 
zugrunde gelegten Hypothesen. Haufig werden aber in verschiedenen Teilen der 
betrachteten Personengruppen, Untersuchungsbedingungen oder Variablen die theo- 
retischen Erwartungen in unterschiedlichem AusmaB bestatigt. Mitunter sind die 
Ergebnisse auch so uneindeutig, dass eine erhebliche Unsicherheit iiber die Giiltig- 
keit der empirischen Hypothesen bestehen bleibt. 

AbschlieBend konnen mogliche Konsequenzen fur weitere theoretische Entwick- 
lungen, empirische Untersuchungen und praktische Anwendungen aufgezeigt und 
erortert werden. 





13 Validitat einer Untersuchung 



Im Folgenden wird zunachst die Validitat einer Untersuchung allgemein definiert 
(Kapitel 13.1). Dann werden Strenge, Wohlwollen und Fairness als Aspekte dieser 
Validitat charakterisiert (Kapitel 13.2 und 13.3). AbschlieBend wird die bekannte 
Unterscheidung zwischen interner und externer Validitat eingeordnet (Kapitel 13.4). 



13.1 Validitat als Wahrscheinlichkeit von richtigen Entscheidungen 

Im vorangegangenen Kapitel haben wir gesehen, dass in einer empirischen 
Untersuchung die empirische Hypothese gepriift wird, dass bestimmte Variablen- 
zusammenhange in der betrachteten Situation bestehen. Die angenommenen 
Zusammenhange zwischen den psychologischen Variablen konnen in einem Theorie- 
Element T formuliert werden. Die Untersuchungssituation kann als Partialmodell 
und zweifelhafte Anwendung dieses Theorie-Elementes beschrieben werden. Die 
gepriifte empirische Hypothese (EH) entspricht der Aussage, dass dieses 
Partialmodell a zum Geltungsbereich von T gehort: a e G(T). 

Die Validitat einer Untersuchung soil, allgemein gesagt, ihre Eignung, Gtite oder 
Fahigkeit bezeichnen, zu einer richtigen Entscheidung fiber die empirische 
Hypothese zu ftihren. Dies umfasst zwei Aspekte: falsche empirische Hypothesen 
mirssen als falsch und richtige empirische Hypothesen miissen als richtig erkannt 
werden. Eine empirische Untersuchung hat also eine perfekte Validitat, wenn keine 
richtige Hypothese als falsch und keine falsche Hypothese als richtig bezeichnet 
wird. 

Praktisch werden wir eine Untersuchung mit perfekter Validitat nie identifizieren 
konnen. Erstens ist nie absolut sicher, ob eine empirische Hypothese tatsachlich 
richtig oder falsch ist. Wir konnen deshalb nie sicher sein, dass eine Untersuchung 
zu einer richtigen Entscheidung geftihrt hat. 

Zweitens kann jedes Untersuchungsergebnis fehlerhaft sein. Zum einen werden 
unsere Beobachtungen von unseren Erwartungen, Motiven, Kenntnissen usw. 
beeinflusst. Zum anderen kann jeder beobachtete Sachverhalt von anderen als den 
untersuchten Faktoren beeinflusst werden, ohne dass wir dies wissen oder erfahren. 
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0 Empirische Ergebnisse konnen falschlicherweise fur eine empirische Hypothese 
sprechen, wenn die Untersuchungspersonen ihre Antworten bewusst oder unbewusst so 
geben, dass sie mit den (mutmaBlichen) Erwartungen der Versuchsleiter konform sind. 649 

Da Untersuchungen mit perfekter Validitat nicht zu realisieren sind, kann das Ziel 
nur in der Maximierung der Validitat bestehen: 

• Jede empirische Untersuchung ist so zu gestalten, dass ihre Validitat so groB wie 
moglich wird. 

Um systematisch iiberlegen zu konnen, ob konkrete Aspekte der Versuchsplanung 
oder -durchfuhrung tatsachlich zu einer Erhohung der Validitat ftihren, soil das 
Konzept der Validitat im Folgenden praziser definiert werden. 650 

Tabelle 13.1: Validitat einer Untersuchung: Entscheidungsalternativen und 

Entscheidungswahrscheinlichkeiten 



Entscheidung 


tatsachlicher Zustand 
EH zutreffend EH unzutreffend 


EH akzeptiert 
EH abgelehnt 


1-f e 

f 1 -e 



Zur Vereinfachung gehen wir weiterhin davon aus, dass die empirische Hypothese 
tatsachlich entweder wahr oder falsch, zutreffend oder unzutreffend ist. 
Dementsprechend soli es auch bei der Beurteilung der empirischen Hypothese nur 
zwei Alternativen geben: Die EH wird entweder als zutreffend akzeptiert oder als 
unzutreffend abgelehnt. Es gibt dann vier Entscheidungsalternativen (siehe Tabelle 
13.1). In zwei von ihnen wird eine falsche Entscheidung getroffen, in den anderen 
beiden eine richtige. Die bedingten Wahrscheinlichkeiten fiir die falschen 
Entscheidungen bezeichnen wir mit e und f, die fiir die richtigen mit 1 — e und 
1-f. 652 

• Die EH ist unzutreffend, wird aber akzeptiert. Die bedingte Wahrscheinlichkeit 
ftir eine derartig efalschliche Akzeptierung wird mit e bezeichnet. 

• Die EH ist zutreffend, wird aber abgelehnt. Die bedingte Wahrscheinlichkeit ftir 
eine derartig e falschliche Ablehnung wird mit f bezeichnet. 

• Die EH ist unzutreffend und wird auch abgelehnt. Die bedingte Wahrschein- 
lichkeit ftir eine derartige richtige Ablehnung ist gleich 1 - e . 

• Die EH ist zutreffend und wird auch akzeptiert. Die bedingte Wahrscheinlichkeit 
fiir eine derartige richtige Akzeptierung ist gleich 1-f , 653 



649 

650 

651 

652 

653 



Rosenthal (1969) 

Westermann (1987a, S. 108-113; 1987c, S. 37-38) 

Es soil also keine Zwischenzustande wie „teilweise zutreffend 44 geben. 
zu bedingten Wahrscheinlichkeiten: Bortz (1999, S. 54-55), Hays (1994, Kap. 1.12) 

Es wird also definiert e := P(EH akzeptiert I EH falsch) und f := P(EH abgelehnt I EH 
zutreffend). Daraus folgt nach dem Additionssatz der Wahrscheinlichkeitsrechnung 
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Ausdriicklich zu betonen ist, dass diese Entscheidungswahrscheinlichkeiten nicht 
bekannt sind und auch nicht konkret ermittelt oder berechnet werden konnen. Sie 
sind abstrakte theoretische GroBen, die fiir methodische Analysen sehr niitzlich sind: 
zum einen fiir die Definition der Validitat einer Untersuchung, zum anderen um zu 
iiberlegen, durch welche Vorgehensweisen die Validitat erhoht werden kann. 

Nachdem die Entscheidungswahrscheinlichkeiten eingefiihrt sind, kann genauer 
umschrieben werden, was die Validitat einer Untersuchung bedeuten soil: 

• Die Validitat einer Untersuchung ist um so groBer, je groBer die Wahrschein- 
lichkeit ist, dass die Untersuchung Ergebnisse erbringt, die zu einer richtigen 
Entscheidung liber die geprlifte empirische Hypothese flihren. 

Aus dieser Definition ergeben sich verschiedene konkretere Konsequenzen, die fiir 

• • 

Uberlegungen zur Gestaltung von empirischen Untersuchungen relevant sind: 

• Die Validitat einer Untersuchung wird groBer, wenn sowohl die Wahrschein- 
lichkeit e fiir eine falschliche Akzeptierung als auch die Wahrscheinlichkeit f fiir 
eine falschliche Ablehnung der empirischen Hypothese EH kleiner wird. 

• Die Validitat wird groBer, wenn e sinkt und f gleich bleibt. 

• Die Validitat wird groBer, wenn f sinkt und e gleich bleibt. 

Umgekehrt fiihren erhohte Fehlerwahrscheinlichkeiten zu einer Verringerung der 
Validitat: Die Validitat wird kleiner, wenn sowohl e wie f ansteigen oder wenn eine 
dieser beiden Wahrscheinlichkeiten steigt und die jeweils andere gleich bleibt. 

Wenn die beiden Fehlerwahrscheinlichkeiten sich gegenlaufig verandern, das 
heiBt wenn e sinkt und f steigt oder wenn f sinkt und e steigt, kann keine Aussage 
daruber getroffen werden, ob die Validitat groBer oder kleiner wird, da die genauen 
Werte von e und f ja unbekannt sind. 

Durch welche Vorgehensweisen die Validitat erhoht werden kann, wird vor allem 
im Kapitel 14 besprochen. Zuvor miissen noch die beiden Aspekte naher erlautert 
werden, die nach unserer Definition in die Validitat einer Untersuchung einflieBen 
und die wir als die Strenge und das Wohlwollen der Untersuchung bezeichnen. 



13.2 Strenge einer Prufung 

Nach der Falsifikationsmethodologie von Popper kann Erkenntnisfortschritt nur fiber 
die Falsifikation (und anschlieBende Verbesserung) von Theorien erfolgen. Deshalb 
stellt Popper die methodische Forderung auf, dass die empirischen Priifungen von 
Theorien so streng wie moglich sein sollen. Dabei ist die Prufung einer Theorie in 
einer Untersuchung um so strenger, je weniger sich das von der gepriiften Theorie 
vorhergesagte Ergebnis auch aus anderen bewahrten oder akzeptierten Theorien oder 



(Bortz, 1999, S. 54) dann P(EH abgelehnt I EH falsch) = 1-e und P(EH akzeptiert I EH 
zutreffend) = 1-f. 





294 



Kapitel 13 



Annahmen ableiten lasst. 654 Die konnen konkurrierende inhaltliche Theorien sein, 
aber auch Annahmen liber storende Einflussfaktoren. 

0 Die aus der Dissonanztheorie vorhergesagte groBere Meinungsanderung bei geringerer 
Belohnung folgt auch aus Attributions- und Selbstwahrnehmungstheorien. 655 Sie wiirde 
auch aus der Annahme folgen, dass die Probanden die Erwartungen des Versuchsleiters 
kennen und sie durch ihre MeinungsauBerungen bestatigen wollen. 

Je strenger eine Priifung ist, desto schwerer wird es einer unzutreffenden Hypothese 
gemacht, sich zu bewahren, und desto groBer ist die Chance, dass unzutreffende 
Hypothesen auch als solche erkannt und abgelehnt werden. Poppers Forderung nach 
strengen Prlifungen entspricht in unserer Validitatskonzeption der Forderung, dass 
die Wahrscheinlichkeit 1 — e moglichst groB, dass also die Wahrscheinlichkeit e 
moglichst klein sein soli: Je kleiner e ist und je groBer damit die Komplementarwahr- 
scheinlichkeit 1 - e ist, desto groBer ist die Wahrscheinlichkeit, dass eine unzutref- 
fende EH tatsachlich abgelehnt wird und desto kleiner ist das Risiko, dass eine 
Hypothese sich falschlicherweise bewahrt. 

Da die Wahrscheinlichkeit e nicht bekannt ist, kann man die Strenge einer Prli- 
fung nicht quantitativ ausdriicken. Man kann aber verschiedene Untersuchungen 
oder verschiedene mogliche Vorgehensweisen innerhalb einer bestimmten Untersu- 
chung hinsichtlich ihrer Strenge vergleichen. Man kann also sagen, dass eine Unter- 
suchung strenger ist als eine andere oder dass die eine Durchflihrungs- oder Aus- 
wertungsstrategie zu einer strengeren Priifung flihrt als die andere. 

Stehen fur die Priifung einer Theorie verschiedene mogliche Anwendungen zur 
Verfiigung, kann man die Strenge der Priifung erhohen, indem man Umstande wahlt, 
die fur eine Bewahrung der Theorie besonders ungiinstig sind. Besonders strenge 
Prlifungen sind moglich, wenn die Theorie fur eine bestimmte Situation Vorhersagen 
macht, die sehr ungewohnlich sind und weder aus dem Alltagsverstandnis noch aus 
anderen akzeptierten theoretischen Konzeptionen abzuleiten sind. 

0 Fur den Anwendungsbereich der sozialen Kommunikationsprozesse enthalt die 
Dissonanztheorie unter anderem die spezielle Gesetzesannahme, dass eine Person ihre 
Meinung umso eher an die eines Kommunikators anpasst, je attraktiver oder kompetenter 
dieser erscheint. Die daraus abzuleitenden Vorhersagen sind auch aus etlichen anderen 
Theorien und der Alltagserfahrung zu gewinnen. Die Gesetzesannahme iiber die groBere 
Meinungsanderung bei geringerer Belohnung fur einstellungskontrares Verhalten erlaubt 
dagegen ungewohnlichere Vorhersagen und damit strengere Prlifungen. 

In einer bestimmten Untersuchungssituation kann man die Strenge der Priifung 
erhohen, indem man die Kriterien verscharft, die erfiillt sein miissen, bevor man die 



Popper (1965, S. 391; 1985, S. 238-239). Die hier betrachtete Strenge, mit der eine 
Theorie in einer Untersuchung gepriift wird, ist von der Strenge zu unterscheiden, mit 
der eine Theorie priifbar ist (siehe oben Kapitel 10.2.1). 

Weiner (1988, S. 243-246), Bern (1967) 
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gepriifte empirische Hypothese als bewahrt akzeptiert. Sehr haufig folgt aus der 
Gliltigkeit der gepriiften empirischen Hypothese eine statistische Mittelwerts- 
vorhersage wie z.B. y, >y 2 (siehe oben Kapitel 12.3.2). In diesem Fall kann man 
die Strenge beispielsweise durch folgende Kriterienverscharfungen erhohen: 

- der Mittelwertsunterschied soil nicht nur auf dem 5%-, sondern auch auf dem \%- 
Niveau signifikant sein, 

- der Mittelwertsunterschied soli nicht nur signifikant sein, sondern auch sehr groB, 

- der Mittelwertsunterschied soil nicht nur in der Gesamtgruppe der Personen 
auftreten, sondern auch in relevanten Untergruppen (z.B. Manner und Frauen). 

- der Mittelwertsunterschied soil nicht nur auf der abhangigen Variablen Y 
auftreten, sondern auch auf anderen abhangigen Variablen Y’, Y” usw. 

Wenn sich zwei mogliche Untersuchungen in einem derartigen Punkt unterscheiden, 
in alien anderen Punkten aber gleich sind, ist die eine strenger als die andere. 



13.3 Wohlwollende und faire Prtifungen 

Erhoht man die Strenge einer Untersuchung, d.h. verringert man die Fehlerwahr- 
scheinlichkeit e fur falschliche Bewahrungen, fiihrt dies in aller Regel dazu, dass die 
Wahrscheinlichkeit f fur falschliche Ablehnungen der EH erhoht wird. Die 
Komplementarwahrscheinlichkeit 1 - f fur die Akzeptierung einer zutreffenden EH 
wird damit verringert. Durch eine Erhohung der Strenge wird es also auch 
zutreffenden empirischen Hypothesen schwerer gemacht, sich zu bewahren. 

Poppers Forderung nach strengen Prlifungen muss deshalb erganzt werden: 
Hypothesen miissen auch angemessene Bewahrungschancen haben, insbesondere bei 
den ersten Prlifungen. Bei der Gestaltung einer Untersuchung muss also auch 
darauf geachtet werden, dass die Wahrscheinlichkeit f ausreichend klein und die 
Wahrscheinlichkeit 1 — f ausreichend groB ist. Je groBer 1-f ist, desto wohlwol- 
lender nennen wir die Priifung. 

Auch das Wohlwollen ist nicht numerisch genau auszudriicken, sondern nur im 
Vergleich zwischen verschiedenen moglichen oder tatsachlichen Untersuchungen. 
Erhohen kann man das Wohlwollen generell durch Priifung von Theorien unter 
besonders gtinstigen Umstanden. In konkreten Untersuchungen wird das Wohlwollen 
beispielsweise dadurch erhoht, dass man eine Hypothese auch dann als bewahrt 
betrachtet, wenn der vorhergesagte Mittelwertsunterschied das 5%- 
Signifikanzniveau knapp verfehlt, wenn er nur in einigen Teilgruppen von Personen 
oder nur bei einigen abhangigen Variablen auftritt usw. 



656 



Pahler (1981), Gadenne (1984, S. 81-86), Hager & Westermann (1983a, S. 29-32) 
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Fairness 

Wie die vorausgegangen Absatze deutlich gemacht haben, wird durch MaBnahmen 
zur Erhohung der Strenge meist das Wohlwollen gesenkt, und Erhohungen des 
Wohlwollens senken die Strenge. Prinzipiell lasst sich jede Untersuchung so 
gestalten, dass sie extrem streng oder extrem wohlwollend ist. Bei einer extrem 
strengen Untersuchung wird die empirische Hypothese mit sehr hoher Wahrschein- 
lichkeit abgelehnt, auch wenn sie zutreffend ist. Bei einer extrem wohlwollenden 
Untersuchung wird die EH sehr wahrscheinlich akzeptiert, auch wenn sie unzutref- 
fend ist. In beiden Extremfallen sagt das empirische Untersuchungsergebnis kaum 
etwas liber die tatsachliche Gultigkeit der gepriiften Theorien und Hypothesen aus. 
Den hochsten Informationswert haben hingegen empirische Untersuchungen, bei 
denen Strenge und Wohlwollen gleich groB sind. Wenn dies der Fall ist, bezeichnen 
wir die Untersuchung als ein efaire Priifung der empirischen Hypothese. 

Obwohl die beiden Wahrscheinlichkeiten 1 - e und 1 - f nicht numerisch genau 
bestimmbar sind, sollte man bei der Gestaltung der Untersuchung stets das Ziel 
verfolgen, die empirische Hypothese nicht offensichtlich unfair zu priifen. 657 



13.4 Interne versus externe Validitat 

Die Merkmale und Bedingungen des Experiments, die die Strenge, das Wohlwollen 
und die Fairness der Priifung (eventuell) beeinflussen, werden als (potenzielle) 
Storvariablen der Validitat bezeichnet. Ublicherweise werden diese moglichen 
Storvariablen in verschiedene Gruppen eingeteilt. Dementsprechend unterscheidet 
man verschiedene Aspekte der Validitat einer Untersuchung. In den folgenden 
Kapiteln 14 bis 17 werden wir ausftihrlich die Storvariablen der internen Validitat 
und der statistischen Validitat besprechen. 

Die Begriffe der internen und statistischen Validitat stammen aus Arbeiten von 
Donald Campbell zur Planung von Experimenten und Quasi-Experimenten und sind 
in der Psychologie auBerordentlich bekannt geworden. 659 Sie beziehen sich auf die 
zwei wichtigen Entscheidungen, mit denen ein empirischer Forscher konfrontiert ist: 

• Gibt es eine statistische Beziehung zwischen den konkret untersuchten Variablen? 
Unterscheiden sich beispielsweise die Werte der abhangigen Variablen in 
Experimental- und Kontrollgruppe systematisch? ( statistische Validitat ) 

• Kann eine vorliegende statistische Assoziation als eine kausale Beziehung 
betrachtet werden? Haben beispielsweise die verschiedenen Behandlungen in der 



65 V 

In einigen Darstellungen wird der Begriff der Fairness in anderer Bedeutung verwendet 
und bezeichnet den Teilaspekt der Validitat, der hier Wohlwollen genannt wird 
(Erdfelder & Bredenkamp, 1994). 

658 Storvariablen werden haufig auch als Stor faktoren bezeichnet. 

659 Campbell & Stanley (1963), Cook & Campbell (1979) 
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Experimental- und der Kontrollgruppe die unterschiedlichen Auspragungen der 
abhangigen Variablen ursachlich hervorgebracht? ( interne V aliditat) 

Jede Bedingung, die die Wahrscheinlichkeit erhoht, dass eine dieser Fragen falsch 
beantwortet wird, ist eine Storvariable der statistischen bzw. internen Validitat. 

Storungen der statistischen Validitat mtissen in jeder Untersuchung vermieden 
werden, das heiBt sowohl in Experimenten und Quasi-Experimenten wie in einfachen 
Gruppenvergleichen und Korrelationsstudien. Wie wir im Kapitel 15 im Einzelnen 
sehen werden, besteht eine haufige Storung der statistischen Validitat darin, dass die 
Teststarke des Signifikanztests zu gering ist. Vermieden werden konnen diese 
Storungen durch eine adaquate Testplanung. 

Die interne Validitat ist Voraussetzung fur die valide Priifung von Kausal- 
hypothesen in Experimenten oder Quasi-Experimenten. Sie ist gestort, wenn 
systematische Unterschiede zwischen der Kontroll- und der Behandlungsgruppe 
bestehen, die iiber die unterschiedlichen experimentellen Behandlungen hinaus- 
gehen. Dies wird durch eine Randomisierung ausgeschlossen. 

Neben der internen und der statistischen Validitat werden von Campbell und 
anderen Autoren noch die externe Validitat und die Konstrukt- oder Variablen- 
validitat beschrieben. Sie werden durch die folgenden beiden Fragen charakterisiert: 

• Beziehen sich die kausal assoziierten Variablen tatsachlich auf die zu unter- 
suchenden theoretischen Begriffe? (V ariablenv aliditat) 

• Lasst sich die kausale Beziehung zwischen diesen Konstrukten auf andere 

Personen, Situationen und Zeitpunkte generalisieren? ( externe Validitat) 

• • 

Das folgende Kapitel 13.5 enthalt einen kurzen Uberblick zur Variablenvaliditat. Die 
sog. externe Validitat wird im Kapitel 18 besprochen, das auf die Identifikation von 
Moderatorvariablen abzielt, von denen die Geltungsbereiche der psychologischen 
Hypothesen und Theorie-Elemente abhangen. 



13.5 Variablenvaliditat 

Die Variablenvaliditat betrifft die adaquate Erfassung oder Operationalisierung von 
nicht direkt beobachtbaren Konzepten durch empirische Beobachtungen oder 
Messungen. 

9 Wenn die Hypothese gepriift werden soil, dass der Meinungsunterschied nach einem 
einstellungskontraren Verhalten um so kleiner ausfallt, je kleiner die Belohnung ist, 
mtissen die Konzepte „Meinungsunterschied“, „einstellungskontrares Verhalten 11 und 
„Belohnung“ operationalisiert werden. 

• Ganz allgemein ausgedrlickt ist die Validitat einer empirischen Variablen und des 
entsprechenden Erhebungsverfahrens um so hoher, je eindeu tiger und sicherer die 
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individuellen Auspragungen der interessierenden theoretischen Variablen durch 
die individuellen Auspragungen der empirischen Variablen erfasst werden. 

Eine perfekte Variablenvaliditat lage vor, wenn wir aus der Auspragung der 
erhobenen empirischen Variablen mit Sicherheit auf die Auspragung der inter- 
essierenden theoretischen Variablen schlieBen konnten. Eine derartige absolute 
Sicherheit ist nur zu erreichen, wenn wir die theoretische und empirische Variable 
als Equivalent definieren. Dies ist nur dann moglich, wenn die 
substanzwissenschaftliche Hypothese sich bereits auf sehr konkrete Variablen 
bezieht, beispielsweise auf Reaktionszeiten oder Anzahl von richtigen Antworten. 660 

0 Wenn einer Personengruppe 1 DM und der anderen 8 DM gezahlt werden, entsprechen 
die Auspragungen der UV eindeutig einer geringeren und einer hoheren Auspragung der 
interessierenden Ursachenvariablen „Belohnung“. 

Da ein theoretischer Begriff aber meist mehr ausdriicken soil als jede empirische 
Variable, lasst sich die Validitat einer empirischen Variablen in der Regel nicht 
eindeutig und vollstandig sichern. Man kann vielmehr nur versuchen, sich mit unter- 
schiedlichen Methoden einer optimalen Variablenvalidierung anzunahern. 

Theoretische und empirische Validierung 

Eine Zuordnung von empirischen Operationen oder Beobachtungen zu theoretischen 
Konzepten kann als begriffliche Festlegung oder als empirische Hypothese 
aufgefasst werden: 661 

• Interpretiert man eine Operationalisierung als analytische Aussage, das heiBt als 
Definition oder Konvention, muss sie theoretisch und argumentativ begriindet 
werden: dadurch, dass sie einfach oder plausibel ist, dass sie erfolgreich oder 
niitzlich ist, dass sie mit einer bestimmten Theorie vertraglich ist usf. 

• Fasst man eine Operationalisierung als synthetische, das heiBt empirisch 
gehaltvolle Aussage auf, muss sie zusatzlich durch die Ergebnisse empirischer 
Untersuchungen bestatigt werden. 

Im Idealfall sollte jede Zuordnung einer empirischen und einer theoretischen 
Variablen nicht nur theoretisch gut begriindet sein, sondern sich auch in strengen 
empirischen Uberpriifungen bewahrt haben. Tatsachlich lassen sich aber viele 
Operationalisierungsannahmen nur sehr unvollkommen theoretisch ableiten oder 
empirisch uberprlifen. Mitunter werden deshalb nur Plausibilitatsliberlegungen 
angestellt oder Erfahrungen aus dem Alltag herangezogen. 



660 Im Kapitel 5.3 wurde dargestellt, dass die Forderung, alle theoretischen Begriffe durch 
operationale Definitionen vollstandig auf empirische Beobachtungen zuriickzufuhren, zu 
inakzeptablen Konsequenzen fiihrt. Vor allem konnte man verschiedene empirische 
Phanomene nicht mehr einheitlich theoretisch beschreiben und erklaren. 

Opp (1976, S. 223-225), Gadenne (1984, S. 23-39) 



661 





V aliditat einer Untersuchung 



299 



Methoden zur Validierung 

Die zur Sicherung der Variablenvaliditat adaquaten Wege sind je nach Art der 
betrachteten empirischen Variablen und theoretischen Konstrukte sehr 
unterschiedlich und konnen nur bedingt in Form von allgemeingiiltigen Regeln und 
Empfehlungen beschrieben werden. Um zu beurteilen, wie gut die Passung zwischen 
den empirischen und den theoretischen Variablen ist, muss in der Regel auf 
fachliches Hintergrundwissen zurtickgegriffen werden, das heiBt auf Theorien und 
empirische Befunde zu diesen Konzepten. 

• Die Variablenvaliditat ist um so hoher, je stringenter sich eine 
Operationalisierung begriinden lasst und je besser die Theorien und Befunde 
abgesichert sind, auf die man dabei zurlickgreift. 

0 Um die GroBe der Meinungsunterschiede empirisch zu erfassen, konnen Fragen und 
Antwortalternativen so gestaltet werden, dass sie mit einer bewahrten Einstellungstheorie 
vertraglich sind und dass die bekannten Tendenzen zu Antwortverfalschungen minimiert 
werden. 

Generell ist die Variablenvaliditat um so hoher, je besser die folgenden Bedingungen 
erfiillt sind (jeweils unter Konstanz aller anderen Bedingungen): 

• Die realisierten Auspragungen der empirischen Variablen decken alle moglichen 
Auspragungen der theoretischen Variablen ab. Bei unabhangigen Variablen 
werden nicht nur mittlere Bereiche realisiert, sondern auch extreme 
Auspragungen. Dadurch wird die Durchschlagskraft der unabhangigen Variablen 
erhoht: Hat sie tatsachlich eine Wirkung auf die abhangige Variable, wird dies mit 
hoherer Wahrscheinlichkeit entdeckt. 

• Stehen fur ein theoretisches Konzept mehrere adaquate Operationalisierungen zur 
Verfugung, werden moglichst viele von ihnen verwendet ( konzeptuelle 
Replikation) . Konnen nur einige der vorliegenden Operationalisierungen 
eingesetzt werden, sollen diese moglichst verschiedenartig sein. 

• Das Skalenniveau der empirischen Variablen entspricht dem Begriffstypus der 
theoretischen Variablen. Wenn in der wissenschaftlichen Hypothese quantitative 
Begriffe, Veranderungen oder Differenzen angesprochen werden, muss die 
empirische Variable mindestens Intervallskalenniveau haben. Bezieht sich die 
wissenschaftliche Hypothese hingegen nur auf monotone Zusammenhange, 
gentigt Ordinalskalenniveau. 

Ein bestimmtes Skalenniveau einer empirischen Variablen ist allerdings noch keine 
Garantie dafur, dass sie eine sinnvolle Operationalisierung eines quantitativen 
theoretischen Konzeptes darstellt. So ist Ordinalskalenniveau notwendig, aber nicht 
hinreichend dafur, dass die Ordnung der empirischen Werte der Ordnung der 



im einzelnen: Hager & Westermann (1983a, S. 33-46) 
Bredenkamp (1980, S. 31-34), McClelland (1997, S. 4-5) 
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theoretischen Merkmalsauspragungen entspricht, und Intervallskalenniveau ist 
notwendig, aber nicht hinreichend dafur, dass die beobachtbaren Zahlendifferenzen 
die interessierenden Merkmalsunterschiede widerspiegeln. 

Das Skalenniveau einer Variablen ist keineswegs eindeutig bestimmt, sondern 
hangt davon ab, ob sie als Ergebnis einer reprasentationalen, einer abgeleiteten oder 
einer sog. Indexmessung betrachtet wird. Als (Index-)Messungen auf dem hochsten, 
dem Absolutskalenniveau konnen wir diejenigen psychologischen Variablen betrach- 
ten, die auf Abzahloperationen beruhen. Dazu gehoren Testwerte (Anzahl der positiv 
beantworteten Items), Reaktionszeiten (Anzahl der Millisekunden) und direkte 
Einschatzungen (Anzahl der „ubersprungenen“ Antwortkategorien). 664 

Zwei weitere fur die Sicherung der Variablenvaliditat besonders wichtige Aspekte 
werden im Folgenden etwas ausftihrlicher angesprochen. Zum einen muss die 
Konfundierung von Variablen vermieden werden (Kapitel 13.5.1). Zum anderen 
miissen Tests und Skalen so konstruiert sein, dass sie eine moglichst hohe Validitat 
und Reliabilitat haben (Kapitel 13.5.2). 

13.5.1 Konfundierung von Variablen 

Beeintrachtigt wird die Variablenvaliditat einer empirischen Untersuchung vor allem 
dadurch, dass verschiedene theoretische Begriffe konfundiert werden. Eine Konfun- 
dierung liegt dann vor, wenn eine empirische Variable als Operationalisierung 
mehrerer theoretischer Variablen betrachtet werden kann. 

0 In verschiedenen Experimenten werden den Personen wiederholt und unabhangig von 
ihren tatsachlichen Ergebnissen sehr schlechte Leistungen zuruckgemeldet. Dies ist eine 
Methode zur Induktion von gedriickter Stimmung, der resultierende Zustand wird aber 
auch als „Hilflosigkeit“, „Frustration“ oder „Misserfolgserlebnis“ interpretiert. 

Selbst bei sehr konkreten Variablen kann sich die Operationalisierung bei naherer 
Betrachtung als uneindeutig erweisen, weil Variablen konfundiert sein konnen. 

0 Die Zahlung von 1 DM oder 8 DM an jeden Probanden entspricht nicht unbedingt nur 
unterschiedlichen Auspragungen der Variable „Belohnung“. Beispielsweise konnte es 
sein, dass die Zahlung von 1 DM als „Beleidigung“ oder „Ausbeutung“ empfunden wird 
und ein aggressives Beharren auf der bisherigen Meinung nach sich zieht. 

Reaktions stile 

Die Antworten von Personen in psychologischen Befragungen, Tests oder 
Skalierungen werden nicht nur von den tatsachlichen Sachverhalten oder Meinungen 
bestimmt, sondern (mehr oder minder stark) auch von sog. Reaktionsstilen ( response 
sets). 665 Wiederholt empirisch aufgezeigt werden konnten vor allem zwei 



664 

665 



Suppes & Zinnes (1963), Dawes (1977), Westermann (1987a, S. 128-140) 

Sprung & Sprung (1987, 403-404), Mummendey (1995), Bortz & Doring (1995, S. 170- 
172, 210-216), Zuckerman & Knee (1995), Sudman, Bradburn & Schwarz (1996) 
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Verfalschungstendenzen: die Tendenz zu sozial erwiinschten Antworten und die Ja- 
Sage-Tendenz (d.h. die Tendenz zur Bevorzugung positiver Antworten). Tritt eine 
dieser Tendenzen bei der Erhebung einer (abhangigen) Variablen auf, liegt eine 
Konfundierung mit den eigentlich interessierenden theoretischen Variablen vor. 

Diese Konfundierung fiihrt aber nicht zwangslaufig zu einer Beeintrachtigung der 
Validitat eines Experimentes. Nur wenn ein Reaktionsstil unter einer Auspragung der 
unabhangigen Variablen anders ausgepragt ist als unter einer anderen, wird die 
Wahrscheinlichkeit fur Fehlentscheidungen iiber die empirische Hypothese erhoht. 

Vermeiden oder verringern kann man die Verfalschung der Antworten durch 
Reaktionsstile durch eine adaquate Gestaltung der Erhebungssituation. Um die 
Tendenz zu sozial erwiinschten Antworten zu reduzieren, muss moglichst verhindert 
werden, dass die Personen irgendeine soziale Bewertung oder Kontrolle beflirchten. 
Um eine Ja-Sage-Tendenz auszugleichen, miissen die Fragen moglichst varianten- 
reich und mit unterschiedlichen Zielrichtungen formuliert werden. 

0 Die Meinung zur Senkung des Wahlalters kann iiber den Grad der Zustimmung oder 

Ablehnung (z.B. auf einer Skala von -5 bis +5) zu folgenden Aussagen erfasst werden: 

- Alle Burger sollen moglichst friih an der politischen Willensbildung mitwirken. 

- Ohne gewisse Lebenserfahrung kann man nicht beurteilen, was fur das Land gut ist. 

Zustimmende Antworten sprechen bei der ersten Frage fur, bei der zweiten gegen eine 

Senkung des Wahlalters. 

Erwartungseffekte 

Das Verhalten und die Antworten der Probanden einer Untersuchung konnen auch 
von ihren Erwartungen darliber beeinflusst werden, was das Ziel der Untersuchung 
ist und was von ihnen erwartet wird. In diesem Fall sind in den Antworten die 
Erwartungen und die interessierende theoretische Variable konfundiert. Diese 
Probandenerwartungen hangen von verschiedenen Anforderungsmerkmalen der 
Untersuchungssituation ab ( demand characteristics). Zu diesen Determinanten 
gehoren die Erwartungen der Versuchsleiter, das heiBt ihre Auffassungen iiber die zu 
erwartenden Versuchsergebnisse. 666 

Wenn in den Experimentalbedingungen unterschiedliche Versuchspersonen- 
erwartungen auftreten, wird die Validitat gestort und die Wahrscheinlichkeit fur 
Fehlentscheidungen erhoht. 

Um die Bildung unterschiedlicher Erwartungen in den Versuchsbedingungen zu 
verhindern, kann man die Probanden zur Bildung einer falschen Erwartung verleiten, 
man kann sie aber auch iiber den Zweck des Experimentes aufklaren und sie um 
Kooperation und Ehrlichkeit bitten. 



666 



Rosenthal & Rosnow (1969), Bungard (1980, 1984), Bredenkamp (1980, Kap. IV), 
Hager & Westermann (1983a, S. 43-45), Harris & Rosenthal (1985), Valentine (1991) 
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13.5.2 Tests und Skalen 

Wenn eine (abhangige) Variable sich auf individuelle Fahigkeiten, Eigenschaften 
• • 

oder Ahnliches bezieht, kann zur Operationalisierung auf psychologische Tests und 
Skalen zuriickgegriffen werden. Ihre Ergebnisse bestehen im einfachsten Fall darin, 
dass jede Person aufgrund ihrer Antworten eine Zahl zugeordnet bekommt. Um ein 
Merkmal zu erfassen, werden in der Regel mehrere Fragen oder Aufgaben gestellt 
und die Antworten auf eine geeignete Weise zusammengefasst. 

0 Frey und Irle baten jeden Probanden, seine Meinung zur Senkung des Wahlalters auf 
einer elfstufigen Ratingskala anzugeben, die von +5 (stark fiir die Herabsetzung) iiber 0 
bis -5 (stark gegen die Herabsetzung) reichte. In anderen Experimenten werden haufig 
mehrere Fragen zur untersuchten Thematik gestellt und die Antworten gemittelt. 

Im Allgemeinen ist die Validitat von Tests und Skalen um so hoher, 

• • 

• je groBer die Ubereinstimmung zwischen den Inhalten der Fragen oder Aufgaben 
und der Bedeutung des zu erfassenden Konstrukts ist ( inhaltliche Validitat ) 

• je hoher die empirische Variable mit anderen Operationalisierungen des 
interessierenden Konstrukts korreliert ( konvergente Validitat ), 

• je geringer die empirische Variable mit Operationalisierungen von anderen 
Konstrukten korreliert, die nach der zugrunde liegenden Theorie vom inter- 
essierenden Konstrukt unabhangig sind ( divergente Validitat ). 667 

Die Hohe der konvergenten Validitat, die fiir ein empirisches Erhebungsverfahren zu 
erreichen ist, hangt ganz wesentlich von der Genauigkeit ( Reliabilitat ) der Zahlen- 
zuordnung ab. Diese Reliabilitat ist im allgemeinen um so hoher, 

• je weniger das Erhebungsergebnis von subjektiven Einfliissen der Forscher 
abhangig ist ( Objektivitat ), 

• je hoher die Ergebnisse der Aufgaben oder Fragen miteinander korrelieren, die zu 
einer einzigen Variablen zusammengefasst werden ( Homogenitat ), 

• je gleichmaBiger die Antworten auf die positiven und negativen Alternativen 
verteilt sind ( mittlere Schwierigkeit). 

Die verschiedenen Kriterien und Methoden fiir die optimale Operationalisierung von 
theoretischen Variablen im Einzelnen zu beschreiben und zu bewerten, sprengt den 
Rahmen dieses Buches und bleibt einer nachfolgenden Darstellung vorbehalten. 



667 

uo Untersuchungen konvergenter und divergenter Validitaten sind die Hauptbestandteile 
einer sog. Konstruktvalidiemng (siehe oben Seite 217). Die Ergebnisse werden system- 
atisch in einer Multitrait-Multimethod-Matrix (MTMM) zusammengestellt (Campbell & 
Fiske, 1959; Ostendorf, Angleitner & Ruch, 1986; Saris & Mtinnich, 1995). 

668 Literatur siehe oben FuBnoten 40 bis 42, Seite 26f 





14 Interne Validitat 



Die schwersten Beeintrachtigungen der Validitat einer psychologischen Untersu- 
chung sind die Storungen der sog. internen Validitat. Grab gesagt ist eine Untersu- 
chung dann intern valide, wenn die Untersuchungsbedingungen sich bis zur Erhe- 
bung der abhangigen Variablen (AV) ausschlieBlich dadurch unterscheiden, dass die 
unabhangigen Variablen (UV) verschiedene Auspragungen haben. Alle Variablen 
auBer den gezielt variierten UV miissen also in alien Untersuchungsbedingungen die 
gleiche Auspragung oder die gleiche Verteilung haben. Diese Gleichheit oder 
Gleichverteilung aller nicht primar interessierenden Merkmale bezeichnen wir als 
Ceteris-paribus-Bedingung. Die interne Validitat heiBt deshalb auch Validitat der 
Ceteris-paribus-Bedingungen. 

Wenn die interne Validitat gegeben ist, konnen Unterschiede auf der abhangigen 
Variablen nur durch die unterschiedlichen Auspragungen der unabhangigen Variab- 
len verursacht worden sein. Das empirische Ergebnis einer intern validen Unter- 
suchung ist also eindeutig kausal interpretierbar. 

Die interne Validitat kann durch verschiedene Arten von Storvariablen beein- 
trachtigt werden (Kapitel 14.1), und es gibt verschiedene Verfahrensweisen, diese 
Storungen zu vermeiden: Konstanthaltung (Kapitel 14.2), Randomisierung (Kapitel 
14.3) und Kontrollfaktoren (Kapitel 14.4). 



14.1 Einteilung von Storvariablen 

Die interne Validitat einer Untersuchung ist ein theoretisch definierbares Ideal. 
Empirisch lasst sich nie positiv feststellen, dass eine Untersuchung vollstandig intern 
valide ist, denn die Menge der moglichen Variablen, hinsichtlich derer sich die 
Untersuchungsbedingungen unterscheiden konnen, ist stets unendlich groB. Das Ziel 
kann deshalb nur darin bestehen, die Untersuchung so zu gestalten, dass man sich 
dem Ideal der intern validen Untersuchung so weit wie moglich nahert. Dazu muss 
man versuchen, die moglichen und die tatsachlichen Storvariablen zu identifizieren 
und zu kontrollieren. 
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14.1.1 Mogliche Storvariablen 

Jede Abweichung von den Ceteris-paribus-Bedingungen, das heiBt jeder Unterschied 
zwischen den Untersuchungsbedingungen vor Erhebung der AV, der liber die 
unabhangigen Variablen hinausgeht, kann die Wahrscheinlichkeit von Fehl- 
entscheidungen liber die empirische Hypothese erhohen und ist eine mogliche 
Storvariable der internen Validitat. Mogliche Storvariablen der internen Validitat 
sind also Variablen, die mit der unabhangigen Variablen der Untersuchung 
kovariieren, korrelieren oder statistisch assoziiert sind. 669 Die Stoning der internen 
Validitat ist dabei (unter sonst gleichen Bedingungen) um so groBer, je groBer die 
statistische Assoziation ist. 

Die moglichen Storvariablen der internen Validitat konnen in drei Gruppen 
eingeteilt werden: Unterschiede zwischen den Situationen, Unterschiede zwischen 
den Personen und Unterschiede zwischen den Positionen. 

(1) Unterschiede zwischen Situationen 

Die interne Validitat kann gestort werden, wenn die raumlichen, zeitlichen oder 
situationalen Umstande sich unterscheiden, unter denen die verschiedenen Aus- 
pragungen der unabhangigen Variablen realisiert werden. 

0 In einer Untersuchung zur Abhangigkeit der Meinungsangleichung von der erhaltenen 
Belohnung werden die Personen in der Untersuchungsbedingung mit hoher Belohnung 
uberwiegend in einem luxuriosen Tagungshotel mit vielen Kontakt- und Unterhaltungs- 
moglichkeiten untergebracht und von weltlaufigen, selbstsicheren Wissenschaftlern 
untersucht. Die meisten Personen in der Bedingung mit geringer Belohnung dagegen 
miissen mehrere Stunden in stickigen und dunklen Kellerraumen der Universitat 
verbringen und werden von angstlichen Hilfskraften untersucht. In diesem Fall liegt eine 

mogliche Stoning der internen Validitat vor: Die Variable „Angenehmheit des 

670 

Untersuchungsortes“ korreliert mit der UV ,,Belohnungshohe“. 

Weitere mogliche Storvariablen der internen Validitat eines psychologischen 
Experiments sind Unterschiede zwischen den Auspragungen der UV hinsichtlich der 
Untersuchungszeitpunkte, des Instruktionswortlautes, des Versuchsleiterverhaltens, 
der Larmbelastigungen, der Antwortregistrierung usw. 



im Einzelnen: Steyer (1983, Kap. 5; 1994, Kap. 2) 

670 Die Hohe der Korrelation lasst sich in diesem Fall einfach liber eine Vierfelder- 
Haufigkeitstafel (siehe Bortz, 1999, S. 218-219) berechnen. Sind alle Personen in der 
einen Gruppe im Hotel und alle Personen der anderen Gruppe in der Universitat 
untersucht worden, ist die (Punkt-Vierfelder- oder Phi-) Korrelation zwischen beiden 
Variablen gleich 1. Sind beispielsweise von den 50 Personen der niedrig belohnten 
Gruppe 40 im Hotel untersucht worden und von den 50 hochbelohnten Personen nur 20, 
betragt die Korrelation 0,41. Die mogliche Beeintrachtigung der internen Validitat ist 
also geringer. Noch geringer ist sie, wenn in der einen Gruppe 20 und in der anderen 21 
Personen im Hotel untersucht worden sind (Korrelation gleich 0,02). 
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(2) Unterschiede zwischen Personen 

Werden unter den Auspragungen der unabhangigen Variablen verschiedene 
Personen untersucht (inter-individuelle Bedingungsvariation), kann die interne 
Validitat durch alle Unterschiede zwischen diesen Personengruppen gestort werden. 

0 Wenn in der einen Untersuchungsbedingung (hohe Belohnung) der Anted der 
Gymnasiasten an den Untersuchungspersonen hoher ist als in der anderen Bedingung 
(niedrige Belohnung), liegt eine mogliche Storung der internen Validitat vor, denn die 
UV korreliert mit dem Merkmal „besuchte Schule“ und damit auch mit alien mit ihr 

assoziierten Personlichkeitsmerkmalen (Intelligenz, soziale Schicht, politische Kenntnisse 

, 671 

USW.). 

Unterschiede zwischen den Personen in den Untersuchungsbedingungen konnen 
auBerdem hinsichtlich des Anteils der Geschlechter, des mittleren Lebensalters, der 
Mitarbeitsbereitschaft, der Vorerfahrung mit ahnlichen Versuchen usw. bestehen. 

(3) Unterschiede zwischen Positionen 

Bei wiederholter Untersuchung der gleichen Person unter verschiedenen Auspra- 
gungen der unabhangigen Variablen ( intra-individuelle Bedingungsvariation) kann 
die interne Validitat dadurch gestort sein, dass die Werte der abhangigen Variablen 
nicht nur von der gerade realisierten Auspragung abhangen, sondern auch von 
vorangegangenen Behandlungen beeinflusst werden. Die speziellen Storungen bei 
intra-individueller Bedingungsvariation werden als Sequenzeffekte bezeichnet. Sie 
konnen in folgende Gruppen eingeteilt werden: 

• Eine spatere Behandlung kann anders wirken, weil die Wirkung einer friiheren 

• • 

Behandlung noch nicht abgeklungen ist. Dies wird als Ubertragungsejfekt (carry- 
over effect) oder Vermengung von Behandlung swirkungen bezeichnet. 

0 Wenn Personen zuerst fur 1 DM und spater fur 8 DM einen einstellungskontraren 
Aufsatz schreiben sollen, erleben sie den zweiten Betrag als einen erhohten und damit 
als eine echte Belohnung fiir das einstellungskontrare Verhalten. Werden Personen 
dagegen erst unter der 8 DM- und spater unter der 1 DM-Bedingung untersucht, 
erleben sie die zweite Belohnung als eine verminderte und damit eventuell sogar als 
eine Bestrafung fur das einstellungskontrare Verhalten. 

• Eine spatere Behandlung kann wegen eines zwischenzeitlichen Geschehens anders 
wirken als eine fruhere, das heiBt weil relevante Bedingungen verandert oder 
bedeutsame Ereignisse eingetreten sind. 

• Durch die Abfolge verschiedener Bedingungen werden die Personen dazu 
angeregt, Vermutungen liber die untersuchten Fragestellungen und die erwarteten 



Die Zahlenbeispiele aus der FuBnote 670 sind unmittelbar tibertragbar. Sind beispiels- 
weise in der einen Bedingung 40 der 50 Personen Gymnasiasten, in der anderen Gruppe 
20, betragt die Korrelation zwischen „Belohnungshohe“ und „ besuchte Schule“ 0,41. 
Hager (1987, S. 96-103), Keren (1993) 
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Ergebnisse aufzustellen. Zumindest einige Personen versuchen, ihre Antworten 
daran auszurichten (. Erwartungseffekte ). 

• Die Personen konnen durch friihere Behandlungen aufmerksamer und 
empfanglicher fur spatere werden ( Sensitivierung ), aber auch unempfindlicher 
gegenliber spateren Beeinflussungen ( Desensitivierung ). 

• Die Personen sind bei spateren Behandlungen mit der Situation und den Aufgaben 
vertrauter ( Ubung ), sie konnen aber auch unter einer korperlichen oder geistigen 
Ermiidung leiden. 

• Die Personen werden bei spateren Behandlungen eine Erinnerung an ihre 
Antworten bei frtiheren Behandlungen haben. Sie konnen versuchen, beim 
zweiten Mai moglichst ahnliche Antworten zu geben, sie konnen aber auch 
bewusst nach einer Variation der Antworten streben. 

14.1.2 Tatsachliche Storvariablen 

Nach dem bisher Gesagten ist jede vor der AV auftretende Variable, die mit der 
unabhangigen Variablen der Untersuchung korreliert oder assoziiert ist, eine 
mogliche Storvariable der internen Validitat. Nicht jede mogliche Storvariable der 
internen Validitat setzt auch tatsachlich die Validitat der Untersuchung herab. Die 
Wahrscheinlichkeiten fur Fehlentscheidungen iiber die empirische Hypothese wird 
durch einen bestimmten Unterschied zwischen den Untersuchungsbedingungen nur 
erhoht, falls die entsprechende Variable auch mit der abhangigen Variablen der 
Untersuchung statistisch assoziiert ist. 

0 Die unterschiedliche Verteilung der Untersuchungsorte auf die Untersuchungs- 
bedingungen oder die unterschiedliche Zusammensetzung der Personengruppen in den 
Untersuchungsbedingungen fiihrt nur dann zu einer tatsachlichen Storung der internen 
Validitat, wenn die Werte der abhangigen Variablen „Meinungsunterschied“ vom 
Untersuchungsort bzw. von der Schulform beeinflusst werden, das heiBt wenn die AV mit 
den moglichen Storvariablen „Untersuchungsort“ oder „besuchte Schulform 11 assoziiert 
ist. 

Ob eine mogliche Storvariable tatsachlich einen Einfluss auf die abhangige Variable 
hat, lasst sich fur eine konkrete Untersuchungssituation empirisch allenfalls 
feststellen, wenn die experimentelle Bedingungsvariation erfolgt und die abhangige 
Variable erhoben ist. Die Beeintrachtigung der internen Validitat lasst sich dann aber 
nicht mehr vermeiden. 674 Deshalb ist es notwendig, vor dem Experiment mogliche 



673 siehe oben Seite 301 

6V4 

Die Wirkungen der unabhangigen Variablen und der Storvariablen auf die AV sind dann 
nicht mehr eindeutig zu trennen. Es liegt damit kein valides Experiment vor, sondern 
bestenfalls ein Quasi-Experiment. Statistisch abgeschatzt werden kann nur noch die 
Wirkung beider Variablen zusammen (multiple Korrelation, siehe Bortz, 1999, S. 433- 
456) sowie jeweils die Wirkung einer Variablen bei Konstanthaltung der anderen 
(Partialkorrelationen, siehe Bortz, 1999, S. 429-433). 
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Storvariablen zu identifizieren, Erwartungen iiber ihre Auswirkungen abzuleiten und 
sie dann gegebenenfalls zu kontrollieren. Vermutungen iiber die Wirkungen einer 
moglichen Storvariablen werden als Storhypothesen bezeichnet. 

0 Unterscheiden sich die Untersuchungsorte zwischen den Experimentalbedingungen, hat 
diese mogliche Storvariable vermutlich eine Wirkung auf die abhangige Variable, da 
nach verschiedenen Theorien und empirischen Befunden sowohl angenehme Umstande 
wie hohes Sozialprestige die Bereitschaft fordern, sich an eine von Anderen vertretene 
Meinung anzunahern. Um diese mogliche Storung der internen Validitat zu vermeiden, 
diirfen die Untersuchungsorte zwischen den Experimentalbedingungen nicht systematisch 
variieren. 

Zur Ableitung und Begrlindung von Storhypothesen kann sowohl Alltags- wie 
Fachwissen herangezogen werden. Wissenschaftlich gut fundierte Storhypothesen 
sind meist gerichtet: Sie spezifizieren die Richtung des Einflusses der potenziellen 
Storvariablen auf die AV. Dadurch kann auch bestimmt werden, ob der Einfluss der 
Storvariablen in die gleiche oder entgegengesetzte Richtung geht wie der vermutete 
Einfluss der unabhangigen Variablen, das heiBt ob die Storvariable den Effekt der 
unabhangigen Variable eher verstarken oder eher abschwachen, neutralisieren bzw. 
gar umkehren wtirde. 

0 Bei einem selbstwerttangierenden, einstellungskontraren Verhalten werden bei kleineren 
Belohnungen groBere Meinungsanpassungen erwartet als bei groBeren Belohnungen. 1st 
der Untersuchungsort in der Bedingung mit groBer Belohnung stets sehr angenehm und 
bei kleiner Belohnung sehr unangenehm, ist die vermutete Wirkung der Storvariablen 
antagonistisch zur vermuteten Wirkung der UV. Sie kann also einen moglichen 
Belohnungseffekt verdecken. 

Wenig fundierte Storhypothesen (wie sie vielleicht von Laien oder Studienanfangern 
auf Grund ihrer Alltagserfahrungen vorgebracht werden) sind haufig ungerichtet und 
unspezifisch. Man nimmt an, dass eine Storvariable etwas mit der abhangigen 
Variablen zu tun hat, kann diese Annahme aber nicht hinreichend begriinden und 
deshalb auch die Richtung der Wirkung nicht angeben. 

Auch eine kaum begrlindete Storvariable kann naturlich wirksam sein und sollte 
deshalb moglichst kontrolliert werden. Vordringlich sind allerdings immer die 
moglichen Storvariablen zu kontrollieren, fur deren Wirksamkeit es empirische oder 
theoretische Anhaltspunkte gibt. 

Um es zusammenzufassen: Eine Variable ist ein tatsachliche Storvariable der 
internen Validitat, wenn sie sowohl mit der UV als auch mit der AV assoziiert ist. 

0 Um die Validitat des Experimentes anzuzweifeln, geniigt es nicht, darauf hinzuweisen, 
dass die Personen in den experimentellen Bedingungen z.B. unterschiedliche Schul- 
bildungen haben. Es geniigt auch nicht, allein auf eine bestehende Abhangigkeit der 
Bereitschaft zu einer Meinungsanderung von der Schulbildung hinzuweisen. Eine 
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begrtindete Vermutung iiber eine Stoning der internen Validitat muss beides beinhalten: 
eine begrtindete Vermutung iiber die Ungleichheit der Schulbildung in den Auspragungen 
der UV und eine begriindete Vermutung iiber die Assoziation der Schulbildung mit dem 
resultierenden Meinungsunterschied. 

Die Assoziationen der interessierenden abhangigen Variablen mit den verschiedenen 
Personlichkeits- oder Situationsmerkmalen sind empirisch vorgegeben und konnen 
vom Experimentator nicht beeinflusst werden. Eine mogliche Storung der internen 
Validitat durch eine bestimmte Variable kann deshalb nur dadurch verhindert 
werden, dass man ihre Assoziation mit der unabhangigen Variablen beseitigt. Dafiir 
gibt es verschiedene Vorgehensweisen, die als (experimen telle) Kontrolltechniken 
bezeichnet werden. 

Bekannte und leicht zu erfassende bzw. zu beeinflussende Storvariablen konnen 
durch Konstanthaltung kontrolliert werden (Kapitel 14.2). Die fur die psycho- 
logische Forschung wichtigste Kontrolltechnik ist die Zufallszuordnung oder Ran- 
domisierung (Kapitel 14.3). Konstanthaltung und Randomisierung konnen kombi- 
niert werden, wenn man mogliche Storvariablen systematisch variiert und als Kon- 
trollfaktoren explizit im Versuchsplan einftihrt (Kapitel 14.4). 



14.2 Konstanthaltung und Elimination von Storvariablen 

Wenn fur eine Untersuchung vermutet wird, dass eine konkrete Variable zu einer 
Storung der internen Validitat fiihrt, kann diese mogliche Storung durch eine 
Konstanthaltung vermieden werden: Es wird dafiir gesorgt, dass die mogliche 
Storvariable fur alle Bedingungen und Personen die gleiche Auspragung hat. 

0 Die mogliche Storung der internen Validitat durch die Variable „Untersuchungsort“ wird 
ausgeschaltet, wenn alle Untersuchungen in der gleichen Umgebung stattfinden (d.h. z.B. 
alle im Hotel oder alle im Universitatsraum). Dementsprechend wird eine Storung durch 
die Variable „besuchte Schulart“ vermieden, wenn nur Gymnasiasten oder nur 
Hauptschuler untersucht werden. 

Konstant gehalten und damit als Storvariablen ausgeschaltet werden in 
psychologischen Experimenten vor allem Merkmale der Versuchsdurchftihrung: der 
Wortlaut der Instruktion, das Reizmaterial, die Darbietungszeiten, die Tasten zur 
Registrierung der Antworten usw. sollen fur alle Untersuchungspersonen gleich sein. 

Ein Spezialfall der Konstanthaltung einer potenziellen Storvariable ist ihre 
Elimination, d.h. ihre Reduzierung auf eine Auspragung von Null. 

0 Alle moglichen Beeintrachtigungen der internen Validitat durch unterschiedliche Sozial- 
kontakte und Ablenkungen werden dadurch vermieden, dass alle Personen wahrend der 
gesamten Untersuchung in abgeschlossenen Raumlichkeiten bleiben miissen. 

0 Mogliche storende Wirkungen durch verschiedene Personlichkeitseigenschaften und 
Verhaltensweisen der Versuchsleiter konnen durch eine automatisierte Versuchsdurch- 
fiihrung (Tonband, Computer usw.) ausgeschaltet werden. 
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Jede Konstanthaltung oder Elimination ist mit einem (mehr oder minder groBen) 
technischen oder organisatorischen Aufwand verbunden. Deshalb werden vor allem 
diejenigen der moglichen Storvariablen konstant gehalten oder eliminiert, fur die es 
die am besten begrundeten Storungshypothesen gibt und fur die die hochsten 
Korrelationen mit der UV und der AV zu erwarten sind. 

Je nach Fragestellung und Untersuchungsgebiet haben damit sehr unterschiedliche 
Arten von Variablen Prioritat. In wahrnehmungspsychologischen Untersuchungen 
miissen vor allem physikalische Reiz- und Umgebungsmerkmale konstant gehalten 
werden (Larmpegel, Beleuchtungsstarken usw.). In der Gedachtnis- und 
Kognitionspsychologie sind beispielsweise die Bekanntheit und Bedeutung des zu 
lernenden Materials oder das Vorwissen der Personen fiber die zu losenden Probleme 
konstant zu halten. In motivations- und sozialpsychologischen Experimenten ist vor 
allem auf die Konstanz von Situations- und Versuchsleitermerkmalen zu achten. 

Die Kontrolle der internen Validitat durch Konstanthaltung oder Elimination ist 
mit verschiedenen Nachteilen behaftet. 

• Die Konstanthaltung und Elimination einer moglichen Storvariable erfordert 
immer einen gewissen Zusatzaufwand bei der Vorbereitung oder Durchfuhrung 
der Untersuchung. Sollen mehrere Variablen gleichzeitig konstant gehalten 
werden, erreicht der notwendige technische oder organisatorische Aufwand leicht 
die Obergrenze des praktisch Machbaren. 

• Konstanthaltung und Elimination ist in natiirlichen Lebenskontexten (Kinder- 
gartengruppen, Schulklassen oder Betriebsabteilungen) meist nicht zu realisieren, 
sondern nur in den speziellen Raumlichkeiten eines „psychologischen Labors“. 

• Praktisch anwendbar sind Konstanthaltung und Elimination nur zur Kontrolle von 
moglichen Storvariablen, die bekannt sind und die durch relativ grobe 
MaBnahmen der Untersuchungsgestaltung angegangen werden konnen. 

0 Leicht konstant zu halten sind objektiv zu erfassende Merkmale von Personen 
(Geschlecht, Alter, usw.) und einfach zu verandernde Merkmale von Situationen 
(Raumeinrichtung, Sozialkontakte usw.). Problematischer gestaltet sich die Konstant- 
haltung von Personlichkeitseigenschaften (z.B. Aggressivitat, Intelligenz), die nur mit 
zusatzlichem Aufwand und begrenzter Genauigkeit und Treffsicherheit (Reliabilitat 
und Validitat) erf asst werden konnen. 

• Durch die Konstanthaltung oder Elimination einer Variablen wird unweigerlich 
der Anwendungsbereich eingeschrankt, auf den sich die Untersuchung bezieht: 
Die Ergebnisse erlauben nur noch Aussagen tiber die Gliltigkeit der 
wissenschaftlichen Hypothese fur die gewahlte Auspragung der Storvariablen. 

0 In der Untersuchung von Frey und Irle wurden z.B. Schultyp, Schulort, Alter, 
Untersuchungssituation und Art des einstellungskontraren Verhaltens konstant 
gehalten. Ihre psychologische Hypothese iiber den Zusammenhang zwischen 
Belohnung und Meinungsanpassung (oder Dissonanz und Dissonanzreduktion auf der 
theoretischeren Ebene) wurde daher nur fur diesen Anwendungsbereich empirisch 
iiberpriift. 
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Eine mogliche Stoning der internen Validitat kann aber auch vermieden werden, 
ohne dass die betreffende Storvariable auf ein bestimmte Auspragung beschrankt 
wird: Es muss erreicht werden, dass die mogliche Storvariable zwischen den 
Untersuchungsgruppen nicht systematisch, sondern nur zufallig variiert. Dazu dient 
die Randomisierung (auch Zufallszuordnung genannt). 



14.3 Randomisierung 

Die wichtigste Randomisierung ist die zufallige Zuordnung der Personen zu den 
Bedingungen (Kapitel 14.3.1). Randomisiert werden konnen aber auch andere 
Untersuchungseinheiten (Kapitel 14.3.2), Reihenfolgen von Bedingungen bei intra- 
individueller Variation (Kapitel 14.3.3) sowie situationale Merkmale (Kapitel 
14.3.4). 

14.3.1 Randomisierung von Untersuchungspersonen 

In psychologischen Experimenten untersucht man in den meisten Fallen 
unterschiedliche Gruppen von Personen unter den verschiedenen Auspragungen der 
unabhangigen Variablen. Bei dieser inter-individuellen Bedingungsvariation kann 
die interne Validitat durch alle Unterschiede gestort werden, die zwischen diesen 
Untersuchungsgruppen bestehen (siehe oben Seite 305). Um diese moglichen 
Storungen der internen Validitat zu vermeiden, werden die einzelnen Untersuchungs- 
personen den verschiedenen Experimentalbedingungen zufallig zugeordnet. 

Nach einer Randomisierung konnen zwischen den Personengruppen durchaus 
noch Unterschiede bestehen. Diese Unterschiede konnen hinsichtlich bekannter oder 
leicht erfassbarer Variablen bestehen, aber auch hinsichtlich Variablen, deren 
Auspragungen unbekannt oder schwieriger feststellbar sind. 

0 Teilt man 48 Untersuchungspersonen, 24 Manner und 24 Frauen, zufallig auf zwei 
Bedingungen zu je 24 Personen auf, wird man nicht selten Unterschiede in der 
Geschlechtsverteilung feststellen: In der einen Gruppen befinden sich beispielsweise 13 
Frauen und 11 Manner, in der anderen 10 Frauen und 14 Manner. In gleicher Weise kann 
die eine Gruppe im Durchschnitt z.B. etwas introvertierter, dicker oder kranker sein als 
die andere (was aber nicht so einfach bemerkt wird). 

Die Wahrscheinlichkeit, dass hinsichtlich einer bestimmten Variablen ein 
Unterschied zwischen den Personengruppen von einer bestimmten GroBe besteht, ist 
jedoch um so kleiner, je groBer die Zahl der zufallig zugeordneten Personen ist. 

0 Werden je 24 Frauen und Manner zufallig auf zwei Bedingungen zu je 24 Personen 
aufgeteilt, ist zu erwarten, dass der Frauenanteil jeweils 12/24 = Vi betragt. Die 
Wahrscheinlichkeit, dass der tatsachliche Anteil deutlich von der Gleichverteilung 
abweicht und z.B. 1/3 oder weniger bzw. 2/3 oder mehr betragt, belauft sich auf etwa 4%. 
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Bei 96 Personen, 48 Frauen und 48 Manner, ware die Wahrscheinlichkeit fiir entspre- 

676 

chende Anteile von hochstens 1/3 oder mindestens 2/3 nur noch gleich 0,2%. 

Durch eine Randomisierung der Personen werden mogliche Storungen durch 
Gruppenunterschiede also „auf lange Sicht“ immer unwahrscheinlicher. Dies gilt 
sowohl fiir bekannte wie unbekannte Variablen und ist ein Grund daftir, dass ein 
Experiment um so aussagekraftiger ist, je mehr Personen untersucht worden sind. 

Wenn man eine Person einer Untersuchungsbedingung zufallig zuordnet, werden 
zwangslaufig auch alle situationalen Merkmale, die von dieser Person abhangen, 
damit zufallig zugeordnet. 

0 Fiihren einige Untersuchungspersonen ihre Aufgaben so engagiert durch, dass die 
jeweiligen Versuchsleiter sie besonders freundlich behandeln, wird durch die Ran- 
domisierung der Personen auch dieses uniibliche Verhalten der Versuchsleiter zufallig 
iiber die Untersuchungsbedingungen verteilt. 

Bemerkt man nach einer Randomisierung noch wesentliche Gruppenunterschiede, 
muss man die drohenden Beeintrachtigungen der internen Validitat nicht unbesehen 
hinnehmen, sondern kann die Randomisierung wiederholen. 

Nach Beginn der experimentellen Behandlungen muss man aber darauf achten, 
dass das Ergebnis der Randomisierung bis zur Erhebung der abhangigen Variablen 
erhalten bleibt. Alle ausgewahlten und zufallig zugeordneten Personen sollten 
vollstandig an der Untersuchung teilnehmen. Ausfalle von Untersuchungspersonen 
konnen die interne Validitat storen, wenn mindestens ein Merkmal dieser 
ausgefallenen Personen mit der experimentellen Behandlung korreliert. 

0 Von den 24 Personen (jeweils 12 Manner und 12 Frauen) in einer Experimental- 
bedingung fallen 3 Frauen und 3 Manner aus. In der anderen fallen 5 Frauen und 1 Mann 
aus, evtl. weil die Bedingung fiir Frauen unangenehm war, fiir Manner aber nicht. Die 
unterschiedliche Zusammensetzung der Personengruppen am Ende der Untersuchung ist 
eine mogliche Storvariable der internen Validitat. Sie stort tatsachlich die interne 
Validitat, wenn die abhangige Variable mit dem Geschlecht assoziiert ist. 

Die Randomisierung ist zur Sicherung der internen Validitat unverzichtbar: Sie ist 
die einzige Moglichkeit, die zahlreichen unbekannten oder nicht erfassbaren 
Storvariablen zu kontrollieren, die sich auf Unterschiede zwischen Personen 
beziehen. Deshalb ist die Randomisierung eine notwendige Bedingung dafiir, dass 
wir eine Untersuchung als ein Experiment bezeichnen (siehe oben Seite 270). 

Dass wir randomisieren miissen, um Storvariablen zu kontrollieren, ist der 
Hauptgrund dafiir, dass in der psychologischen Forschung meist Gruppenergebnisse 
und nicht Einzelfalle betrachtet werden. Obwohl die interessierenden Kausal- 
hypothesen sich auf Prozesse innerhalb einzelner Personen beziehen, konnen wir sie 
mit geniigend hoher interner Validitat nur iiberpriifen, indem wir die Ergebnisse von 
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Fishers exakter Vierfelder-Test bzw. approximativer Chi-Quadrat-Test auf Unabhan- 
gigkeit (Bortz, Lienert & Boehnke, 1990, S. 110-113; Hays, 1994, S. 863-864) 
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mehreren Personen zusammenfassen, die jeweils zufallig einer von verschiedenen 
Bedingungen zugeordnet worden sind. 

Praktische Durchfiihrung 

Durchgeftihrt werden kann eine Zufallszuordnung durch verschiedene Arten von 
,,Zufallsexperimenten“. Dabei konnen auch Vorkehrungen getroffen werden, damit 
in jede der Bedingungen gleich viele Personen kommen. 

0 Beim (vereinfachten) Versuchsplan von Frey und Irle (siehe oben Tabelle 12.7 Seite 285) 
kann man die vier Bedingungen durchnummerieren und fur jede Person einen Wtirfel 
werfen. Wtirfe einer 5 oder 6 werden ignoriert und wiederholt. Um sicherzustellen, dass 
jeder Untersuchungsbedingung die gleiche Zahl von Personen zugeordnet wird, werden 
am besten Lose hergestellt und „ohne Zurucklegen“ gezogen. Fur die erste 
Untersuchungsperson wird eines aus vier Losen gezogen, fur die zweite eines aus den 
verbleibenden drei usf. Fur die ftinfte Person wird wieder eines aus vier Losen 

678 

gezogen. 



Tabelle 14.1: Einige Zufallsanordnungen der Ziffern 0 bis 9 
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Die damit gepriiften sog. Aggregathypothesen haben einen geringeren Gehalt als 
individuenbezogene Kausalhypothesen (Westmeyer, 1998). Dieser Nachteil lasst sich 
aber nicht vermeiden, wenn man vordringlich hoch valide Prtifungen anstrebt. Sowohl 
die statistische Auswertung von Einzelfalluntersuchungen wie die kausale Inter- 
pretation ihrer Ergebnisse ist auBerordentlich fehleranfallig, weil die wiederholt 
erhobenen Werte in schwer abschatzbarer Weise voneinander abhangig sind (Krauth, 
1986a). 

678 

Die Untersuchungspersonen sollten nur dann selbst an der Auslosung beteiligt werden, 
wenn es von Inhalt oder Fragestellung des Experimentes sinnvoll ist zu betonen, dass 
die Art der Aufgabe oder Behandlung zufallsabhangig bestimmt wird. 
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Erleichtert wird die Randomisierung durch Tabellen von Zufallsanordnungen 

fJlQ 

(i random permutations). Zur Verdeutlichung ist in der Tabelle 14.1 ein kleiner 

Ausschnitt aus einer Tabelle von Zufallsanordnungen von zehn Ziffern aufgeftihrt. 

0 Zur zufalligen Zuordnung einer Person zu einer von vier Experimentalbedingungen wahlt 
man in einer Tabelle von Zufallsanordnungen von zehn Ziffern eine Zeile willkiirlich als 
Startpunkt aus. In der Reihenfolge, in der die Ziffern 1 bis 4 in dieser Zeile stehen, 
werden die ersten vier Personen den Bedingungen zugeordnet. Die Ziffern 0 und 5 bis 9 
werden ignoriert. Die nachste Zeile dient der Zuordnung der folgenden vier Personen usf. 

Haufiger als Tabellen mit Zufallsanordnungen findet man Tafeln mit Zufallszahlen 
( random digits). 680 Sie bestehen aus Hunderten oder Tausenden von Ziffern (0 bis 9), 
die jeweils zufallig bestimmt worden sind. Sie sind vor allem zur zufalligen Auswahl 
von Stichprobenelementen aus Populationen nlitzlich (siehe unten Seite 335), konnen 
aber auch zur Zufallszuordnung eingesetzt werden. 

9 Zur zufalligen Zuordnung einer Person zu einer von vier Experimentalbedingungen wahlt 
man willkiirlich eine der Ziffern in einer Tabelle von Zufallszahlen als Startpunkt aus. 
Steht an der nachsten Stelle eine 1, 2, 3 oder 4, ordnet man die Person dieser 
Experimentalbedingung zu. Andere Ziffern ignoriert man und geht zur nachsten Stelle. 

Aus einer Tabelle von Zufallsanordnungen der Ziffern 0 bis 9 lassen sich auch 
Zufallszahlen gewinnen. Man greift dazu eine Ziffer willkiirlich als Startpunkt 
heraus und liest dann die folgenden Ziffern spaltenweise nach oben oder unten ab. 

14.3.2 Randomisierung anderer Untersuchungseinheiten 

In den meisten psychologischen Experimenten stellen einzelne Personen 
(gegebenenfalls auch einzelne Tiere) die Untersuchungseinheiten und Merk- 
malstrager dar, das heiBt die Werte der abhangigen Variablen fur jeden untersuchten 
Organismus werden als Rohdaten genommen. Dementsprechend miissen die 
Untersuchungspersonen oder -tiere den Experimentalbedingungen zufallig zuge- 
ordnet werden, um Storungen der internen Validitat so weit wie moglich zu ver- 
meiden. 

Bei der Untersuchung etlicher Fragestellungen und Hypothesen sind die Unter- 
suchungseinheiten und Merkmalstrager jedoch bestimmte Gruppen von Personen 
(z.B. Ehepaare, Familien, Schulklassen, Abteilungsangehorige) oder andere mehr 



679 Fisher & Yates (1963), Yaremko, Harari, Harrison & Lynn (1982/83), Snodgrass et al. 
(1985), Winer etal. (1991) 

680 Fisher & Yates (1963), Kreyszig (1968), Kriz (1983), Snodgrass et al. (1985), Levine & 
Parkinson (1994), MacBurney & Middleton (1994). In SPSS werden im Menu 
Transformieren - Berechnen (Syntax: COMPUTE) durch die Funktion UNIFORM(max) 
Zufallszahlen zwischen 0 und der gewahlten Zahl max erzeugt. Da die Ziffern in den 
Programmen und Tabellen durch deterministische Algorithmen generiert werden, heiBen 
sie korrekt PsewJo-Zufallszahlen bzw. -Anordnungen. 
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oder minder abstrakte Untersuchungseinheiten (z.B. Schulen, Betriebe, Lander). Zur 
Sicherung der internen Validitat miissen dann diese komplexeren Einheiten zufallig 
den Untersuchungsbedingungen zugeordnet werden. 

0 Es soli untersucht werden, ob der Erfolg von Familientherapien von der Art der 
Therapieorientierung abhangt. Dazu werden zwei Experimentalbedingungen hergestellt: 
psychoanalytische und gesprachstherapeutische Therapie. Nach Ende der Therapie soli 
der Erfolg bei jeder Familie durch einen „neutralen“ Experten nach ausfuhrlichen 
Beobachtungen und Gesprachen auf einer Skala von -10 bis +10 eingeschatzt werden. 
Untersuchungseinheiten sind hier die Familien. Zur Sicherung der internen Validitat muss 
jede Familie zufallig einer der Therapiebedingungen zugeordnet werden. 

14.3.3 Randomisierung von Reihenfolgen 

Die Sequenzeffekte, die bei der intra-individuellen Bedingungsvariation auftretenden 
speziellen Storungen der internen Validitat, konnen dadurch verringert werden, dass 
die Reihenfolgen zufallig bestimmt werden, in der die verschiedenen Bedingungen 
realisiert werden. Dafiir gibt es im wesentlichen drei Moglichkeiten: vollstandiges 
Ausbalancieren, Zufallsanordnungen und unvollstandiges Ausbalancieren: 681 

• Die K moglichen Abfolgen der m Bedingungen Ai bis A m werden in zufallige 

/TOO 

Reihenfolge gebracht. Fiir die ersten K Personen werden diese Abfolgen 
nacheinander realisiert, fiir die nachsten K Personen in anderer zufalliger Reihen- 
folge usw. 1st die Zahl der Personen genau gleich K oder gleich einem Vielfachen 
von K, sind die Reihenfolgen und Positionen vollstdndig ausbalanciert. 

• Fiir jede einzelne Person wird die zufallige Reihenfolge der Behandlungs- 
bedingungen bestimmt, am besten mit Hilfe einer Tabelle von Zufalls- 
anordnungen. In diesem Fall muss die Zahl der Personen nicht genau gleich einem 
Vielfachen von K sein. 

• Bei m Auspragungen werden m verschiedene Reihenfolgen so gewahlt, dass jede 
Bedingung gleich haufig an jeder Stelle steht ( unvollstandiges Ausbalancieren). 
1st m eine gerade Zahl, konnen die Reihenfolgen so gewahlt werden, dass jede 
Bedingung gleich haufig vor und nach jeder anderen Bedingung steht. Schreibt 
man die m Reihenfolgen untereinander, nennt man die entstehende Anordnung ein 
Lateinisches Quadrat (Beispiel in Tabelle 14.2). 

Vollstandiges Ausbalancieren oder (insbesondere bei groBen Untersuchungsgruppen) 
zufallige Reihenfolgen sind zur Kontrolle von Sequenzeffekten am besten geeignet. 
Wenn sich in einem Experiment nur eine begrenzte und vergleichsweise kleine Zahl 
verschiedener Reihenfolgen realisieren lasst, muss man auf das unvollstandige 
Ausbalancieren zuriickgreifen. 



ausfuhrlicher: Hager (1987, S. 96-103) 

682 Dies sind K = 1 • 2 • ... ■ m = m! (m-Fakultat, siehe Bortz, 1999, S. 60) verschiedene 
Reihenfolgen. Bei zwei Bedingungen ist K gleich 2, m = 3 ist K = 6 usf. 
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Tabelle 14.2: Lateinisches Quadrat fiir vier Versuchsbedingungen 
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Auch durch vollstandig ausbalancierte oder randomisierte Reihenfolgen wird 
allerdings die Wahrscheinlichkeit fur Storungen der internen Validitat durch 
Sequenzeffekte nur dann auf lange Sicht immer geringer, falls diese Sequenzeffekte 
vollstandig symmetrisch sind. Ein unsymmetrischer Sequenzeffekt liegt dann vor, 
wenn die Auspragung Aj vor der Auspragung Aj anders wirkt als die Auspragung Aj 
vor der Auspragung Aj. 

Kaum Grund fur die Annahme asymmetrischer Sequenzeffekte gibt es bei ganz 
einfachen und schnell ausfiihrbaren Aufgaben wie beispielsweise bei der Beurteilung 
der Lautheit verschiedener Sinustone in der Psychophysik oder der Reproduktion 
sinnarmer Silben in der Gedachtnispsychologie. Hier sind intra-individuelle 
Bedingungsvariationen ohne Probleme moglich. 

0 Um zu priifen, ob das Fechnersche Gesetz die Beziehung zwischen physikalischem 
Gewicht und subjektiven Gewichtsurteil adaquat beschreibt, wurden 17 Reize (von 75 bis 
3400 Gramm) von jeder Versuchspersonen lOmal auf einer Kategorienskala von 1 bis 11 

eingeschatzt. Fur jede Versuchsperson wurde die Reihenfolge der 17 Reize innerhalb der 
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10 Durchgange jeweils mit Hilfe einer Tabelle fiir Zufallspermutationen festgelegt. 

0 Nach der Theorie der Verarbeitungstiefe von Craik und Lockhart ftihrt eine tiefe, 
semantische (bedeutungsbezogene) Verarbeitung von Informationen zu besseren 
Behai tensleistungen als einer oberflachliche, nicht-semantische. 684 In einer Uberprlifung 
bekamen Probanden 40 Substantive fiir jeweils 200 msec tachistoskopisch dargeboten. 
Vor jeder Darbietung bekamen die Personen eine Karte vorgelegt. Bei der einen Halfte 
der Reize war darauf ein unvollstandiger Satz gedruckt (z.B. Auf dem Tisch befand sich 
Bei der anderen Halfte der Reize war auf der Karte eine Abfolge aus Konsonanten 
(K) und Vokalen (V) symbolisiert (z.B. KVKKV). Bei jeder tachistoskopischen 
Reizdarbietung musste so schnell wie moglich entschieden werden, ob das dargebotene 
Substantiv (z.B. TASSE) zum angefangenen Satz passt (semantische Bedingung) bzw. 
aus der angegebenen Folge von Konsonanten und Vokalen besteht (nicht-semantische 
Bedingung). Nach einer kurzen Pause wurden die 40 Substantive zusammen mit 80 
weiteren vorgelegt und die Personen muBten bei jedem Reiz entscheiden, ob er in der 
ersten Phase dargeboten wurde oder nicht. Theoriekonform wurden dabei die Reize aus 
der semantischen Bedingung schneller und haufiger richtig wiedererkannt. Um die 
interne Validitat dieses Experiments mit intra-individueller Bedingungsvariation zu 



Westermann (1987b, S. 275) 

Craik & Lockhart (1972), Lass, Liier & Ulrich (1987, S. 317-319), Zimbardo & Gerrig 
(1999, S. 251) 
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sichern, muss die Abfolge der experimentellen Bedingungen (semantisch vs. nicht- 
semantisch) zufallig bestimmt werden. 

In den meisten anderen Gebieten der Psychologie muss dagegen mit asymmetrischen 
Sequenzeffekten gerechnet werden. Deshalb wird dort zu Recht auf intra- 
individuelle Variationen von experimentellen Bedingungen weitgehend verzichtet. 

14.3.4 Randomisierung von Untersuchungsmerkmalen 

Die interne Validitat eines Experiments kann auch durch situationale Unterschiede 
gestort werden, die liber die beabsichtigten, unterschiedlichen Auspragungen der 
unabhangigen Variablen hinausgehen (z.B. verschiedene Untersuchungsorte, 
Materialien, Darbietungszeiten oder Versuchsleiter, siehe oben Kapitel 14.1). Da 
eine Konstanthaltung derartiger situationaler Storvariablen den betrachteten 
Anwendungsbereich reduziert (siehe oben Kapitel 14.2), ist es haufig vorteilhafter, 
sie durch Randomisierung zu kontrollieren. Da es stets sehr viele mogliche 
Storvariablen gibt, sollte bei der Planung und Durchfuhrung eines Experiments 
danach gestrebt werden, dass moglichst viele situationale Variablen sich zufallig auf 
die Experimentalbedingungen verteilen. Dazu muss man insbesondere die Ver- 
suchstermine, -raume und -leiter zufallig zuordnen. 

• Finden die Untersuchungen der Personen nicht gleichzeitig, sondern an 
verschiedenen Tagen und zu unterschiedlichen Zeiten statt, sollen diese 
Untersuchungstermine den experimentellen Bedingungen zufallig zugeordnet 
werden. Vermieden werden dadurch (zumindest auf lange Sicht) alle Storungen 
der internen Validitat durch Variablen, die mit den Untersuchungsterminen 
assoziiert sind: z.B. eine niedrigere Leistungsfahigkeit in der Mittagszeit, eine 
niedrigere Motivation kurz vor dem Wochenende, eine hohere Ablenkung durch 
Flurgerausche wahrend der Vorlesungszeit usw. 

• Finden die Untersuchungen in unterschiedlichen Raumen, Gebauden oder Orten 
statt, soil fur jeden Untersuchungsort zufallig bestimmt werden, welche der 
Experimentalbedingungen realisiert wird. Dadurch werden alle mit den Versuchs- 
orten assoziierten moglichen Storvariablen kontrolliert. 

• Werden die Untersuchungen durch verschiedene Versuchsleiter durchgefiihrt, 
sollen Versuchsleiter und Experimentalbedingungen einander zufallig zugeordnet 
werden. Dadurch werden alle mogliche Storungen der internen Validitat durch 
Personlichkeits- oder Verhaltensmerkmale der Versuchsleiter minimiert: durch ihr 
Geschlecht, ihr Temperament, ihre soziale Schicht, ihre (vermuteten) Einstel- 
lungen usw. 

In kognitionspsychologischen Experimenten werden abhangige Variablen wie z.B. 
die Behaltensleistung, Reaktionsschnelligkeit, Losungsgute und Verwechselungs- 
haufigkeit typischerweise fiber mehrere Durchgange mit unterschiedlichen Reizen 





Interne Validitat 



317 



erfasst und anschlieBend gemittelt. Um systematische Einflusse von Reizsequenzen 
zu vermeiden, sollten Auswahl und Abfolgen der Reize stets moglichst zufallig sein. 

0 Bei der experimentellen Prtifung der Theorie der Verarbeitungstiefe (siehe voran- 
gegangenes Kapitel) konnen verschiedene Untersuchungsmerkmale fur jede Person 
einzeln nach dem Zufallsprinzip bestimmt werden: welche Untermenge von 40 Reize aus 
der Gesamtmenge der 120 Substantive fur die Beurteilung ausgewahlt werden, ob ein 
Reiz der semantischen oder der nicht-semantischen Beurteilungsbedingung zugeordnet 
wird, ob der Vorreiz auf der Karte zum Reiz passt oder nicht, welcher der geeigneten und 

verfiigbaren Vorreize fur diesen Reiz ausgewahlt werden und in welcher Reihenfolge die 

685 

Reize beim Wiedererkennenstest dargeboten werden. 

In vielen Fallen lassen sich Untersuchungspersonen und Untersuchungsmerkmale 
nicht unabhangig voneinander randomisieren, weil sie (aufgrund praktischer Be- 
schrankungen) nicht vollstandig miteinander zu kombinieren sind. Die Zufalls- 
zuordnung muss dann schrittweise erfolgen. Wie man dabei konkret vorzugehen hat, 
hangt wesentlich von der konkreten Untersuchungs situation ab. 

0 Fur ein dissonanztheoretisches Experiment mit vier Experimentalbedingungen stehen 80 
Untersuchungspersonen und zwei unterschiedliche Untersuchungsraume (einer in einem 
Luxushotel, einer im Institutskeller) mit jeweils 40 fest vorgegebenen Untersuchungs- 
terminen zur Verftigung. Es gibt 10 Versuchsleiter, von denen allerdings 4 nur im Institut 
und 4 nur im Hotel tatig werden konnen. 

a) Fur jeden der beiden Versuchsleiter, die im Hotel und im Institut tatig sein konnen, 
werden vier Termine fur jeden der beiden Orte zufallig ausgewahlt. Dazu werden die 
vierzig Termine pro Ort durchnummeriert, und in einer Tabelle von Zufallszahlen 
wird jeweils die nachste zweistellige Zahl abgelesen. (Zahlen, die liber 40 sind oder zu 
bereits vergebenen Terminen gehoren, werden tiberschlagen.) Auf die gleiche Weise 
erhalten die iibrigen acht Versuchsleiter zufallig jeweils acht Termine an einem Ort. 

b) Jeder Untersuchungsperson wird zufallig ein Untersuchungstermin und ein 
Untersuchungsort zugewiesen. Dazu nummeriert man die Termine liber beide Orte 
von 1 bis 80 durch und bestimmt deren Reihenfolge durch Zufallszahlen. 

c) Jeder der vier Bedingungen werden zehn Termine an jedem Ort zufallig zugeordnet. 
Dazu teilt man die Termine jeweils in Viererblocke ein und bestimmt fur jeden Block 
mit Hilfe von Zufallsanordnungen eine neue Abfolge der vier Bedingungen. 

14.3.5 Randomisierung und Prazision 

Wie wir im Kapitel 14.2 gesehen haben, flihrt die Konstanthaltung oder Elimination 
einer moglichen Storvariablen immer zu einer Einschrankung des Anwendungs- 
bereiches, auf den sich die Untersuchung bezieht. Durch eine Randomisierung wird 
diese Einschrankung vermieden. Gegenliber der Konstanthaltung hat die Randomi- 
sierung allerdings einen wesentlichen Nachteil: Lasst man eine Storvariable zufallig 
variieren und ist sie tatsachlich mit der abhangigen Variablen assoziiert, so wird (im 



685 



Lass, Liier & Ulrich (1987, S. 319) 
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Vergleich zu einer Konstanthaltung dieser Variablen) die Varianz der abhangigen 
Variablen in den Experimentalbedingungen erhoht. 

0 In dem dissonanztheoretischen Experiment kann das durchschnittliche AusmaB des 
verbleibenden Meinungsunterschieds vom Untersuchungsort abhangen, z.B. weil von 
weltlaufigen Versuchsleitern im Luxushotel vertretene Meinungen starker ubernommen 
werden. Deshalb wird innerhalb der Experimentalbedingungen die Varianz der Werte der 
abhangigen Variablen groBer sein, wenn fur jede Person der Untersuchungsort zufallig 
bestimmt wird als wenn der Untersuchungsort fiir alle Personen konstant gehalten wird. 

Durch die hohere Varianz der AV in den Experimentalbedingungen wird die 
Prazision des Experiments verringert (siehe unten Kapitel 15.6): Unter sonst 
gleichen Bedingungen wird die Wahrscheinlichkeit geringer, tatsachlich bestehende 
Unterschiede als statistisch signifikant zu entdecken. Will man diesen Nachteil 
vermeiden, ohne die unbestreitbaren Vorteile der Randomisierung aufzugeben, kann 
man mogliche Storvariablen systematisch variieren und als Kontrollfaktoren 
einftihren. 



14.4 Einftihrung eines Kontrollfaktors 

Zur Kontrolle der internen Validitat kann man die Konstanthaltung und die 
Randomisierung kombinieren. Eine mogliche Storvariable wird nicht auf einem Wert 
konstant gehalten, man lasst sie auch nicht zufallig variieren, sondern man realisiert 
systematisch mindestens zwei Auspragungen der moglichen Storvariablen und fiihrt 
sie als weitere unabhangige Variable in den Versuchsplan ein. Auf jeder Stufe dieses 
zusatzlichen Faktors werden die Personen dann zufallig den Auspragungen des 
anderen Faktors, d.h. den Experimentalbedingungen zugeordnet. 

Im Unterschied zu den inhaltlich interessierenden Experimentalfaktoren 
bezeichnet man unabhangige Variablen, die zur Kontrolle moglicher Validitats- 
storungen eingefiihrt werden, als Kontrollfaktoren. Je mehr Auspragungen ein Kon- 
trollfaktor hat, desto umfassender ist (unter sonst gleichen Bedingungen) die Kon- 
trolle der moglichen Storvariablen. 

Zum einen konnen als Kontrollfaktoren vorgegebene Merkmale der 
Untersuchungseinheiten verwendet werden, zum Beispiel das Geschlecht, die 
Altersklasse, der Beruf oder das Studienfach. Die Personen werden nach ihren 
Auspragungen auf der gewahlten Kontrollvariable klassifiziert und dann zufallig den 
Untersuchungsbedingungen zugeordnet ( randomized blocks design , vgl. oben 
Abschnitt 12.2.2). Man kann die Auspragungen der Kontrollvariablen auch so 
wahlen, dass stets genau K Personen zu jedem Block gehoren, die dann zufallig auf 
die K Auspragungen oder Kombinationen der anderen Faktoren verteilt werden. Man 
spricht dann von einer Parallelisierung oder einem matched sample design. 

0 Ist die Kontrollvariable die Intelligenz der Untersuchungspersonen, bringt man die 

Personen gemaB ihres IQ in eine Rangreihe. Die Personen auf den ersten K Platzen bilden 
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den ersten Block und werden zufallig auf die K Auspragungen oder Auspragungs- 
kombinationen verteilt. Die nachsten K Personen ebenso usf. 

Als Kontrollfaktoren konnen auch experimentell manipulierbare Variablen verwen- 
det werden, deren Auspragungen die Personen zufallig zugeordnet werden konnen. 

0 Zur Prtifung der psychologischen Hypothese iiber den Zusammenhang zwischen 
Belohnungshohe und Meinungsunterschied hatten wir eine unabhangige Variable mit 
zwei Auspragungen definiert (Tabelle 12.1, Seite 272). Wird die mogliche Storvariable 
„Untersuchungssituation“ als zweite unabhangige Variable B eingeftihrt, wird aus dem 
einfaktoriellen Versuchsplan ein zweifaktorieller. Wird beispielsweise jeweils ein fester 
Anteil der Personen in jeder der beiden Experimentalbedingungen im Luxushotel und im 
Institutskeller untersucht, hat dieser Kontrollfaktor zwei Auspragungen (Bi und B 2 ). 

Mitunter werden gleichzeitig auch mehrere Kontrollfaktoren eingeftihrt. Dadurch 
entstehen dreifaktorielle oder noch komplexere Versuchsplane. 

0 Neben dem Experimentalfaktor A (Belohnungshohe) und dem Kontrollfaktor B (Unter- 
suchungssituation) kann als zweiter Kontrollfaktor C der „Bildungsgrad„ der Unter- 
suchungspersonen mit den Auspragungen „Studienabschluss„ (CO, „Hochschulreife„ 
(C 2 ) und „Fachschulreife„ (C 3 ) eingeftihrt werden. Der entstehende dreifaktorielle 
Versuchsplan mit 2 mal 2 mal 3 Zellen ist in Tabelle 14.3 dargestellt. Von den Werten 
der abhangigen Variablen Y ist jeweils nur ein Wert i stellvertretend dargestellt. 




Ist eine Variable als Kontrollfaktor eingeftihrt, kann empirisch geprtift werden, ob 
sie tatsachlich die interne Validitat gestort hatte, falls sie nicht kontrolliert worden 
ware. Eine Variable kann nur dann eine tatsachliche Storvariable der internen 
Validitat sein, wenn sie mit der abhangigen Variablen assoziiert ist (siehe oben Seite 
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306), das heiBt wenn die Mittelwerte der AV fur verschiedene Auspragungen dieser 
Variablen unterschiedlich sind. 

0 Im Experiment zum Zusammenhang zwischen Belohnungshohe (Faktor A) und 
Meinungsunterschied (abhangige Variable Y) wird der Untersuchungsort als Kontroll- 
faktor (Faktor B) eingefiihrt, weil Grand zu der Annahme besteht, dass er das AusmaB 
der Meinungsanderang mitbeeinflusst und deshalb die interne Validitat tatsachlich 
herabsetzen wiirde, falls er nicht kontrolliert wird. Aus dieser Hypothese folgt die 
empirische Vorhersage, dass die Meinungen Y sich liber die verschiedenen 
Auspragungen von B unterscheiden: y.. 1# ^ y.. 2 . in der Notation von Tabelle 14.3. 
Wenn diese Vorhersage zutreffend ist, wurde der Kontrollfaktor B zu Recht eingefiihrt. 

Die Einfiihrung ernes Kontrollfaktors kann auch die Priifung der primar 
interessierenden empirischen Hypothesen verbessern. Zum einen erhoht in der Regel 
jede zusatzliche unabhangige Variable die Prazision der statistischen Hypothesen- 
priifung (siehe unten Kapitel 15.6.2). Zum anderen konnen die empirischen 
Vorhersagen, die aus den interessierenden psychologischen Hypothesen abgeleitet 
worden sind, nicht nur fur die Gesamtgruppe empirisch iiberprtift werden, sondern 
auch fur die einzelnen Auspragungen und Auspragungskombinationen der anderen 
unabhangigen Variablen. Dies ist fur die differenzierte Priifung psychologischer 
Hypothesen sehr wichtig, kann aber erst spater eingehend erlautert werden (siehe 
Kapitel 16.5 zur statistischen Interaktion und Kapitel 18 zur Identifikation von 
Moderatorvariablen). 





15 Signifikanztestvaliditat 



Entscheidungen iiber wissenschaftliche und empirische Hypothesen beruhen, wie wir 
in den vorangegangenen Kapiteln gesehen haben, meist auf den Ergebnissen von 
statistischen Auswertungen, insbesondere auf den Ergebnissen von Signifikanztests. 
Die statistische Validitat einer Untersuchung bezieht sich auf die Adaquatheit der 
statistischen Auswertungen. Sie ist gestort, wenn ein Aspekt der statistischen 
Auswertung die Wahrscheinlichkeit fur eine Fehlentscheidung iiber die empirische 
Hypothese erhoht. 

Die Faktoren, die die statistische Validitat beeintrachtigen, teilen wir in drei 
Gruppen ein, das heiBt wir unterscheiden drei Teilaspekte der statistischen Validitat: 

• Die statistische Validitat wird durch alle Faktoren gestort, die die Fehler- 
wahrscheinlichkeiten a und (3 beim verwendeten Signifikanztest erhohen, z.B. 
Verletzungen der Unabhangigkeitsannahme, zu geringe Fallzahlen, zu geringe 
Prazision usw. ( Signifikanztestvaliditat , in diesem Kapitel 15). 

• Die statistische Validitat wird gestort, wenn die statistischen Hypothesen und 
Verfahren fur die Priifung der interessierenden wissenschaftlichen Hypothese 
nicht optimal ausgewahlt sind ( Hypothesenvaliditat , Kapitel 16). 

• Die statistische Validitat wird durch falsche Interpretation der statistischen 
Ergebnisse gestort, vor allem durch mangelnde Beachtung von Teststarke, 
EffektgroBe oder Fehlerkumulation ( Entscheidungsvaliditdt , Kapitel 17). 

Die herkommliche, auch heute noch haufig realisierte Form des Signifikanztests 

bringt verschiedene Beeintrachtigungen der Validitat mit sich (Kapitel 15.1). Wie die 

Signifikanztestvaliditat erhoht werden kann, hangt auch davon ab, wie der 

• • 

Signifikanztest begrlindet und interpretiert wird. Ublicherweise wird angenommen, 
dass die Personen Zufallsstichproben aus den interessierenden Populationen 
darstellen und dass die betrachteten Variablen in diesen Populationen normalverteilt 
mit gleichen Varianzen sind (Kapitel 15.2). Daraus wird haufig gefolgert, dass 
Signifikanztests ausschlieBlich zur Priifung von Hypothesen iiber unbekannte 
Populationen an Hand von zufalligen Stichproben geeignet sind. Diese Auffassung 
ist aber falsch. Signifikanztests konnen auch unter der Annahme abgeleitet werden, 
dass alle Anordnungen der vorliegenden empirischen Daten gleich wahrscheinlich 
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sind (Kapitel 15.3). Durch dieses Permutationsprinzip lassen sich Signifikanztests 
auch fiir die zahlreichen Falle begriinden, in denen keine Zufallsstichproben 
vorliegen oder keine Annahmen liber Normalverteilung und Varianzgleichheit 
gerechtfertigt sind. 

Um die Wahrscheinlichkeit von Fehlentscheidungen liber empirische Hypothesen 
moglichst gering zu halten, muss der herkommliche Signifikanztest wesentlich modi- 
fiziert werden. Zum einen miissen bei der Entscheidung nicht nur Signifikanzen, son- 
dern auch empirische EffektgroBen beriicksichtigt werden (Kapitel 15.4 und spater 
Kapitel 17.1). Zum anderen muss die Zahl der Untersuchungseinheiten so gewahlt 
sein, dass die Teststarke 1 — (3 ausreichend groB und die Wahrscheinlichkeit (3 fiir 
einen Fehler 2. Art klein genug ist (Kapitel 15.5). AuBerdem kann die Validitat 
eventuell dadurch verbessert werden, dass die Fehler- oder Binnenvarianz verringert 
und damit die Prazision vergroBert wird (Kapitel 15.6). 



15.1 Herkommliche Form von Signifikanztests 

Im Folgenden werden die notwendigen Bestandteile eines Signifikanztests erlautert. 
Sie ergeben, wie wir spater sehen werden, allerdings noch keine optimale Vorge- 
hensweise zur Priifung empirischer Hypothesen. 686 



15.1.1 Bestandteile 

Der Signifikanztest in der herkommlichen Form wird im Folgenden am Beispiel 
eines t-Tests fiir unabhangige Gruppen dargestellt. Er priift Hypothesen liber die 
Erwartungswerte p, und p 2 einer Variablen Y in zwei Experimental- oder Perso- 
nengruppen A! und A 2 . 

(1) Aufstellung einer Nullhypothese und einer Alternativhypothese 

Null- und Alternativhypothesen werden in der Regel so formuliert, dass sie die 
Menge der moglichen Parameter disjunkt und erschopfend einteilen. Die Alternativ- 
hypothese ist beim t-Test, je nach Fragestellung, gerichtet oder ungerichtet. 

• Die ungerichtete Alternativhypothese lautet p, =£ p 2 bzw., anders geschrieben, 
Pi - p 2 ^ 0 . Die entsprechende Nullhypothese H 0 lautet P! = p 2 bzw. p x - p 2 = 0 . 

• Eine gerichtete Alternativhypothese beim t-Test ist P! > p 2 bzw., anders 
geschrieben, p 2 -p, > 0 . Die entsprechende Nullhypothese ist pj>p 2 bzw. 

Pi - p 2 < 0 , 687 



686 Diese tibliche Form entspricht im Wesentlichen der Testtheorie von Fisher (1956). 

687 

Die Nullhypothese muss nicht unbedingt eine Differenz von Null zwischen den beiden 
Mittelwerten behaupten. Sie kann bei entsprechenden Fragestellungen z.B. auch als 
(Lij -p 2 = c bzw. (Lij -|Lt 2 < c formuliert werden, wobei c eine bestimmte Zahl ist. 
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(2) Festlegung des Signifikanzniveaus a 

Es wird die maximale Wahrscheinlichkeit a fur einen Fehler 1. Art festgelegt, das 
heiBt daflir, dass die Nullhypothese abgelehnt wird, obwohl sie richtig ist. Es gilt 

i z.qq 

also: P (Ablehnung von H 0 I H 0 zutreffend) < a. Nach einer weithin akzeptierten 
Konvention wird a meist gleich 0,05 oder gleich 0,01 gesetzt. 

(3) Erhebung der empirischen Daten 

Erhoben werden die Auspragungen der Variablen Y bei n, Personen aus der Gruppe 
A, und n 2 Personen aus der Gruppe A 2 . Die arithmetischen Mittelwerte von Y in 
den beiden Gruppen heiBen y, und y 2 , die Varianzen S[ und s 2 . 

(4) Berechnung des empirischen Wertes der Teststatistik 689 



(15-1) 



kmp 



yi-y 2 



( n t ~l)s^ + (n 2 -l)s 2 
n t +n 2 -2 



n i n 2 

n i + n 2 



Die Zahl der Freiheitsgrade (abgekiirzt FG oder df fur degrees of freedom) ist fur 
diesen Test gleich nj + n 2 - 2 , 690 



(5) Bestimmung der Uberschreitungswahrscheinlichkeit 

Es wird die Wahrscheinlichkeit p dafur ermittelt, dass bei Giiltigkeit der 
Nullhypothese eine t-verteilte Zufallsvariable mit df Freiheitsgraden einen Wert 
annimmt, der mindestens so weit in Richtung der Alternativhypothese liegt wie 

. 691 

temp* 

Bei einer gerichteten Alternativhypothese in positiver Richtung (z.B. p, -p 2 >0) 
ist p die Wahrscheinlichkeit, dass die Teststatistik t mindestens so groB ist wie t emp : 

(15-2) p = P(t>t emp ). 



688 

Der GroBbuchstabe P ist die Abklirzung fur Wahrscheinlichkeit ( probability ). 

689 Die Bestandteile dieser Formel werden unterschiedlich bezeichnet (Bortz, 1999, S. 138; 
Hays, 1994, S. 325-327), auch wird meist einfach t statt t emp geschrieben. 

690 Falls die Varianzen von Y in den beiden Populationsgruppen nicht gleich sind, kann 
eine verallgemeinerte Testform mit weniger Freiheitsgraden benutzt werden (siehe 
unten FuBnote 843, Seite 397). 

691 

In SPSS wird zu jeder berechneten Teststatistik die Uberschreitungswahrscheinlichkeit p 
angegegen. Das Analysesystem STATISTICA sowie das Tabellenkalkulationsprogramm 
EXCEL ermitteln auch zu jedem empirischen t-Wert, den wir per Hand berechnet oder 
aus einem Artikel entnommen haben, das zugehorige p. Abschatzen kann man p-Werte 
auch aus ausfuhrlicheren Tabellen der t-Verteilung (Bortz, 1999, Tabelle D). 
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• • 

Bei einer ungerichteten Alternativhypothese (z.B.: p, — p 2 ^ 0) ist p die Uberschrei- 
tungswahrscheinlichkeit fur absolute Betrage: 

(15-3) p = P(|t|>|t emp |). 

Da bei ungerichteten Alternativhypothesen Abweichungen in beiden Richtungen 
gegen die Nullhypothese sprechen, heiBt der t-Test in diesem Fall zweiseitig, bei 
gerichteten Alternativhypothesen dementsprechend einseitig. 692 

( 6) Entscheidung iiber die statistischen Hypothesen 

Die Nullhypothese FI 0 wird abgelehnt und die Alternativhypothese H! wird 

• • 

akzeptiert, wenn die Uberschreitungswahrscheinlichkeit p kleiner oder gleich dem 
Signifikanzniveau a ist, ansonsten wird die FI 0 (vorlaufig) beibehalten. 

Kritische Werte 

Wenn ein Signifikanztest per Hand oder mit einem einfachen Taschenrechner 
durchgeflihrt wird, kann man bei den beiden letzten Schritten auch die folgende, im 
Ergebnis aquivalente Vorgehensweise wahlen. 

(5*) Bestimmung eines Ablehnungsbereiches 

Aus Tabellen, die in jedem Statistikbuch abgedruckt sind, ermittelt man (fur die 
gegebenen Freiheitsgrade und das gewahlte Signifikanzniveau) den kritischen Wert 
t a , den die Teststatistik t unter Gultigkeit der Nullhypothese nur mit einer 
Wahrscheinlichkeit von hochstens a iiberschreitet: 

(15-4) P(|t| > |t a |) < a fur ungerichtete Alternativhypothesen bzw. 

(15-5) P(t > t a ) < a fur gerichtete Alternativhypothesen. 

Die moglichen Werte von t, die jenseits der kritischen Werte t a liegen, bilden den 
Ablehnungs- oder Rejektionsbereich. 

( 6 *) Entscheidung iiber die statistischen Hypothesen 

Die Nullhypothese H 0 wird abgelehnt und die Alternativhypothese H! wird 
akzeptiert, wenn der empirische Wert der Teststatistik in den Rejektionsbereich fallt. 
Ansonsten wird die H 0 (vorlaufig) beibehalten. 



692 In SPSS wird stets die zweiseitige Uberschreitungswahrscheinlichkeit angegeben. Die p- 
Werte fur einseitige Tests erhalt man durch Halbierung der zweiseitigen p-Werte. 

Man kann zweiseitige Tests auch so auffassen, dass einer exakten Nullhypothese 
(z.B. P[-p 2 = 0) zwei gerichtete Alternativhypothesen gegeniiberstehen. Weicht das 
Ergebnis signifikant von 1 1 (1 ab, wird je nach Richtung der Abweichung H 1A (z.B. 
Pj -p 2 > 0 ) oder Hjg (z.B. u — p 2 <0 ) akzeptiert (Leventhal & Huynh, 1996). 
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Allgemeines Entscheidungsprinzip 

Mit Signifikanztests kann nicht bewiesen werden, dass eine statistische Hypothese 
richtig oder falsch ist. Sie dienen vielmehr dazu, um auf Grund von empirischen 
Daten zu begriindeten Entscheidungen liber die Akzeptierung oder Ablehnung von 
statistischen Hypothesen zu gelangen: Liegt der empirische Wert der Teststatistik in 
einem Bereich, der unter Gultigkeit der Nullhypothese relativ unwahrscheinlich ist, 
wird die Nullhypothese abgelehnt und die Alternativhypothese angenommen. 

15.1.2 Beeintrachtigungen der statistischen Validitat 

Die herkommliche Form des Signifikanztests ist von verschiedenen Standpunkten 
aus als unzulanglich bezeichnet worden. 693 Einige wesentliche Kritikpunkte konnen 
wie folgt zusammengefasst werden: 

1 . Eine exakte Nullhypothese wie m - ft 2 = 0 ist streng genommen niemals wahr, 
denn die Wahrscheinlichkeit, dass eine kontinuierliche Zufallsvariable einen ganz 
bestimmten Wert annimmt, ist stets gleich Null. 

2. Die Entscheidung liber die Nullhypothese beruht auf dem p-Wert, der bedingten 
Wahrscheinlichkeit der erhaltenen (oder extremerer) Daten unter der Nullhypo- 
these: P(D Ho). Diese bedingte Wahrscheinlichkeit sagt nichts iiber die bedingten 
Wahrscheinlichkeiten P(H 0 |D) und P(H! |D) dafiir aus, dass bei den gegebenen 
Daten die Nullhypothese bzw. die Alternativhypothese wahr sind. 

3. Der mit einem empirischen Ergebnis verbundene p-Wert gibt weder die 
Bedeutsamkeit noch die Replizierbarkeit des Ergebnisses an. 

4. Die Signifikanz oder Nicht-Signifikanz eines Tests sagt nicht unbedingt etwas 
iiber die GroBe der Abweichung der Daten von der Nullhypothese aus. 

5. Ob eine vorliegende Abweichung von der Nullhypothese als signifikant entdeckt 
wird oder nicht, hangt sehr stark von der Anzahl der Untersuchungseinheiten ab. 

Die in den ersten drei Punkten zusammengefassten Argumente werden gern gegen 
die Methodik des Signifikanztest ins Feld geftihrt, tatsachlich geben sie aber nur 
vermeidbare Fehler bei der Interpretation der Tests und ihrer Ergebnisse wieder. 

Die ersten beiden Punkte sind nur dann kritisch, wenn man tatsachlich genaue 
Wahrscheinlichkeiten ftir die Wahrheit der gepriiften Hypothesen erwartet und die p- 



Zu Grundlagen und Problemen der Signifikanztests und ihrer Anwendung in der 
Psychologie gibt es altere und neuere Sammelbdnde (Harlow, Mulaik & Steiger, 1997; 
Heerman & Braskamp, 1970; Morrison & Henkel, 1970), Monographien (Abelson, 
1995; Bredenkamp, 1972; Chow, 1996; Rettler, 1985; Stegmiiller, 1973b; Witte, 1980), 
Diskussionen (Carver, 1993; Chow, 1998; Shrout, 1997) und Artikel (Bakan, 1966; 
Cohen, 1994; Cortina & Dunlap, 1997; Dar, Serlin & Omer, 1994; Falk & Greenbaum, 
1995; Frick, 1996; Giere, 1972; Gigerenzer, 1993; Hagen, 1997; Hager, 1987; Kirk, 
1996; Leiser, 1986; Meehl, 1967; Sedlmeier, 1996; Thompson, 1999; Wainer, 1999; 
Westermann & Hager, 1982, 1983a, b). 
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Werte in dieser Richtung fehlinterpretiert. Der Signifikanztest liefert aber per 
definitionem keine Informationen zu P(H 0 I D) und P(Hi I D), den Wahrscheinlich- 
keiten der Hypothesen angesichts der Daten. 694 Die signifikanzstatistischen Entschei- 
dungen liber Akzeptierung oder Ablehnung von Null- und Alternativhypothese 
beruhen vielmehr allein auf P(D I H 0 ), der Wahrscheinlichkeit der Daten unter 
Giiltigkeit der Nullhypothese. 

Wie im dritten Punkt angesprochen, meinen viele Anwender falschlicherweise, 
kleine p-Werte zeigten an, dass die Unterschiede oder Zusammenhange inhaltlich 
bedeutsam sind. Tatsachlich ist der gefundene Effekt nur ceteris paribus um so 
groBer, je kleiner p ist (nur bei konstanten Fallzahlen und Binnenvarianzen). 

In den letzten beiden Punkten wird ein sehr wichtiger Sachverhalt angesprochen. 
Wird zur Entscheidung iiber empirische Hypothesen nur der Signifikanztest in der 
beschriebenen Standardform herangezogen, wird die Validitat der Untersuchung 
unweigerlich beeintrachtigt. Das Risiko fur falsche Entscheidungen liber die 
empirische Hypothese ist erhoht, weil zwei wesentliche GroBen unberiicksichtigt 
bleiben: die GroBe der Abweichung der Daten von der Nullhypothese (der empiri- 
sche Effekt) und die Wahrscheinlichkeit fiir die Entdeckung eines vorliegenden Ef- 
fektes (die Teststarke 1 - (3 ) bzw. die komplementare Wahrscheinlichkeit fur die 
falschliche Beibehaltung der Nullhypothese (die Fehlerwahrscheinlichkeit 2. Art 

(3). 695 

In spateren Teilen dieses Kapitels wird dargestellt, wie Signifikanztests so in den 
Forschungsprozess eingegliedert werden konnen, dass diese Validitatsstorungen 
vermieden werden. Zuvor miissen wir uns jedoch naher mit den theoretischen 
Grundlagen dieses Tests beschaftigen. 



15.2 Signifikanztests als Populationstests 

Zur mathematischen Begrtindung eines Signifikanztests muss gezeigt werden, dass 
eine geeignete Teststatistik unter Giiltigkeit der Nullhypothese eine bestimmte 
Testverteilung hat. Diese Beweise sollen hier nicht dargestellt werden, denn sie 
erfordern Kenntnisse in der mathematischen Statistik, die nicht vorausgesetzt werden 
konnen. Es soil aber versucht werden, die dahinter liegenden Prinzipien deutlich zu 
machen. 



Durch das Bayes-Theorem (Bortz, 1999, S. 57-58; Hays, 1994, S. 45-47) konnen zwar 
A-postcnon-Wahrscheinlichkeiten P(Ho I D) und P(H] I D) berechnet werden, die dazu 
benotigten A-pn'orz -Wahrscheinlichkeiten P(Ho) und P(H| ) sind aber stets unbekannt. 
Man kann sie allenfalls durch subjektive Erwartungen schatzen. 

695 EffektgroBen und Fehler 2. Art werden in der weit verbreiteten Konzeption des Signi- 
fikanztests von R.A. Fisher nicht beriicksichtigt, wohl aber in der Testtheorie von 
Neyman und Pearson (Brenner-Golomb, 1993; Gigerenzer, 1993; Hager, 1992b, S. 36- 
39; Huberty, 1993; Ostmann & Wutke, 1994; Westermann & Hager, 1982). 
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15.2.1 Stichprobenkennwerte-Verteilungen 

Grundlegend fur Signifikanztests sind Stichprobenkennwerte-Verteilungen, das heiBt 
Wahrscheinlichkeitsverteilungen von Stichprobenstatistiken (Mittelwerten, Varian- 
zen, Haufigkeiten usw.). Sie geben an, wie wahrscheinlich es ist (unter bestimmten 
Voraussetzungen), dass die jeweilige Stichprobenstatistik in einem bestimmten 
Bereich liegt. Als Testverteilungen werden die Stichprobenkennwerte-Verteilungen 
bezeichnet, die Verteilungen von gebrauchlichen Teststatistiken sind (von t-Werten, 
F-Werten usw.). 

Veranschaulichung 

Das Konzept der Stichprobenkennwerte- und Testverteilungen soil am Beispiel der 
typischen Hypothesen H 0 : (I, -p 2 - 0 und Hp p, -p 2 > 0 erlautert werden. 

0 Wir wollen untersuchen, ob Mathematikstudenten eine hohere Studienzufriedenheit 
haben als Betriebswirtschaftsstudenten. Dazu lassen wir n, = 32 Mathematikstudenten 
und n 2 = 30 Betriebswirtschaftsstudenten zwei Aussagen beurteilen (abhangige Variable 
Y z.B. mit Werten zwischen 0 und 20). 696 Die Mittelwerte seien = 12,0 und y 2 = 
10,0, die Standardabweichungen sj = 3,0 und s 2 = 4,0. 

Stellen wir uns vor, dass wir wiederholt aus zwei interessierenden Populationen 
Zufallsstichproben des Umfangs n , = 32 und n 2 = 30 ziehen und Stichproben- 
kennwerte berechnen. Da wir Mittelwerte vergleichen wollen, interessiert uns 
besonders der Stichprobenkennwert y , — y 2 . Bei den verschiedenen Stichproben 
werden sich die erhaltenen Mittelwertsdifferenzen voneinander unterscheiden. 

0 Fur yj konnten wir z.B. die Werte 12,0; 10,5; 11,7 usw. bekommen, fur y 2 10,0; 11,3; 
10,2 usw. Als Differenz y 1 - y 2 bekamen wir folglich +2,0; -0,8; +1,5 usw. 

Ziehen wir sehr viele Stichproben, konnen wir empirische Verteilungen von 
Stichprobenkennwerten betrachten, indem wir die Haufigkeiten auszahlen, mit denen 
beispielsweise die verschiedenen Mittelwertsdifferenzen aufgetreten sind. Wir 
konnen auch die Mittelwerte und die Standardabweichungen dieser empirischen 
Mittelwertsdifferenzen berechnen. 

0 Bei 400 Stichproben von Mathematik- und Betriebswirtschaftsstudenten konnten die 
Mittelwertsdifferenzen y, — y 2 beispielsweise im Mittel 1,1 betragen und eine Standard- 
abweichung von 0,8 haben. 

Bei unendlich vielen Stichproben geht diese Haufigkeitsverteilung der empirischen 
Mittelwertsdifferenzen y, - y 2 in eine Wahrscheinlichkeitsverteilung der Zufalls- 
variablen Y, - Y 2 liber. Diese Wahrscheinlichkeitsverteilung ist die Stichproben- 
kennwerte-Verteilung dieser Mittelwertsdifferenz. 

696 Beispielsweise “Insgesamt bin ich mit meinem jetzigen Studium zufrieden” und “Ich 
finde mein Studium wirklich interessant”, wobei der Grad der Zustimmung jeweils 
durch Zahlen von 0 bis 10 kodiert wird (Westermann et al., 1996). 
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Mathematisches Ergebnis 



Tatsachlich ziehen miissen wir die unendlich vielen Stichproben nicht, denn die 
Stichprobenkennwerte-Verteilung kann unter der Voraussetzung mathematisch 
abgeleitet werden, dass die beobachteten Werte unabhangige Realisationen von zwei 
normalverteilten Zufallsvariablen mit gleichen Erwartungswerten sind: 697 



• Wenn Y t und Y 2 normal verteilt sind mit den Varianzen of und c 2 und 
wenn Y t und Y 2 gleiche Erwartungswerte p, = p 2 haben und 

wenn die nj bzw. n 2 Stichprobenwerte unabhangige Realisationen dieser Zufalls- 
variablen Yi und Y 2 sind, 

- dann ist die Stichprobenkennwerte-Verteilung der Mittelwertsdifferenzen, d.h. 
die Verteilung der Zuf alls variable Y, - Y 2 , eine Normalverteilung mit 
Erwartungswert p, - p 2 und Standardabweichung 



(15-6) 



o 



Yi-Y 2 



- & 
n, 



+ 



<3 



n 



- das heiBt die Zufallsvariable 






(15-7) Z = ^i 

°y,-y 2 

ist dann standardnormal verteilt mit Erwartungswert 0 und Varianz 1. 

Da der Erwartungswert von Yj - Y 2 gleich Pj - p 2 ist, konnen wir diese Popula- 
tionsdifferenz erwartungstreu (d.h. ohne systematische Verzerrung) durch unsere 
Stichprobendifferenz y, - y 2 schatzen. 

Die Standardabweichung einer Stichprobenkenn werte- Verteilung wird als 
Standardfehler ( standard error ) der entsprechenden Statistik bezeichnet. Er ist ein 
Ausdruck fur die Unsicherheit der Schatzung des entsprechenden Populationswertes 
(z.B. Pj -p 2 ) durch die Stichprobenstatistik (z.B. y, — y 2 ). Wie an der Definitions- 
formel (15-6) zu sehen ist, ist der Standardfehler in aller Regel viel geringer als die 
Standardabweichungen a, und a 2 der urspriinglichen Zufallsvariablen. Diese Ver- 
ringerung ist proportional zur Wurzel aus der StichprobengroBe. Deshalb konnen wir 
Populationswerte um so genauer schatzen, je groBer die Stichprobe ist (“Konsistenz” 
der Parameterschatzung). 



0 In der fiktiven Untersuchung der Studienzufriedenheit (siehe Seite 327) hat sich y x = 
12,0, y 2 = 10,0, Sj = 3,0 und S 2 = 4,0 ergeben. Zur Veranschaulichung nehmen wir an, 
dass die Populationsvarianzen entsprechend of = 9 und o\ = 16 betragen. Unter der 
Nullhypothese u — u : = ( ) ist Y, - Y 2 dann (approximativ) normalverteilt mit Erwar- 
tungswert 0 und Standardabweichung (dem Standardfehler). 



697 



Fisz (1970, S. 412-413) 
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(15-8) 



c 



Yi-Y, 





32 30 



= 0,9025. 



In der Abbildung 15.1 ist die entsprechende Stichprobenkennwerte-Verteilung 
dargestellt. Darin ist die empirische Mittelwertsdifferenz von 2 sowie der kritische 
Wert eingezeichnet, den die Mittelwertsdifferenzen nur mit einer Wahrscheinlichkeit 

ZTQO 

von a = 0,05 iiberschreiten. 



Wahrscheinl.- 




Abbildung 15.1: Stichprobenkennwerte-Verteilung der Mittelwertsdifferenz y, - y 2 

unter Giiltigkeit der Nullhypothese 



15.2.2 Hypothesenprtifung 



Die Befunde zur Stichprobenkennwerte-Verteilung der Mittelwertsdifferenzen 
konnen wir nutzen, um Hypothesen fiber die entsprechenden 
Populationsunterschiede zu testen, beispielsweise die Nullhypothese Pj - p 2 - 0 
gegen die Alternativhypothese Pj - p 2 > 0 . 

In aller Regel sind die Varianzen der abhangigen Variablen in der Population 
nicht bekannt, sie miissen vielmehr durch die erwartungstreue Stichprobenvarianz 
geschatzt werden. Die Definitionsformel lautet z.B. fur die Gruppe l: 699 



(15-9) 



s? = 



“l-l w 



698 Flir eine Variable, die standardnormalverteilt ist (|Li = 0, a = 1) , ist fiir a = 0,05 (einsei- 
tig) der kritische Wert zq,95 = 1,645. Da die Stichprobenkennwerte-Verteilung hier eine 
Standardabweichung von 0,9025 hat, liegt der kritische Wert bei 1,485. 

699 Bortz (1999, S. 91), Hays (1994, S. 217-218). Die eigentliche Stichprobenvarianz S 2 mit 
ni statt n r l im Nenner (Bortz, 1999, S. 42; Hays, 1994, S. 182-185) ist nicht 
erwartungstreu und wird nur selten verwendet. 





330 



Kapitel 15 



Die geschatzte Standardabweichung der Stichprobenkennwerte-Verteilung der 
Mittelwertsdifferenzen (d.h. ihr Standardfehler) betragt dann analog zu (15-6) 



(15-10) 



s Vy 2 




Kann man annehmen, dass die Varianzen in den beiden entsprechenden Populationen 
gleich sind, of = of =o 2 , wird die gemeinsame Varianz o 2 durch ein gewogenes 
Mittel ( pooled estimate) der Werte s 2 und s 2 geschatzt. 



(15-11) 
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Der geschatzte Standardfehler betragt dann einfach 



(15-12) 
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Mit diesem Standardfehler erhalt man die Teststatistik t, die wir teilweise bereits in 
(15-1) kennen gelernt haben und die strukturell der Teststatistik (15-7) fur bekannte 
Varianzen entspricht: 



(15-13) 



t = yi-y 2 _ yi-y 2 _yi-y 2 / n i n 

l emp 



’ Y, -Yo 



n i +n 2 



n i + n 2 



n i n 2 



Bei Giiltigkeit der exakten Nullhypothese p, — |i 2 = 0 (das ist diejenige unter H 0 
fallende Parametersituation, die am nachsten an dem von F^ abgedeckten Bereich 
liegt), ist die t emp entsprechende Zufallsvariable nicht, wie im Falle bekannter 
Populationsvarianzen, normal verteilt. Sie folgt vielmehr einer t-Verteilung mit 
n i +n 2 -2 Freiheitsgraden (FG oder df). 1 Flir kleinere Stichproben weicht die t- 
Verteilung etwas von der Normalverteilung ab. Je groBer die Stichprobe wird, desto 
besser kann sie durch die Standardnormalverteilung approximiert werden. 



0 Fur die fiktive Untersuchung zur Studienzufriedenheit ergibt sich als Schatzung fur die 
gemeinsame Varianz innerhalb der beiden Populationen nach (15-11): 



g2 _ ( n ! ~l) s i +( n 2 l)s| _ 319 + 29T6 _ ^ 3g 



(15-14) 

F nj + n 2 -2 32 + 30-2 

Der geschatzte Standardfehler der Mittelwertsdifferenz ist: 
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= 0,894 . 



J 



Bortz (1999, S. 137-138), Hays (1994, S. 326), Sp wird auch z.B. als bezeichnet 
Fisz (1970, S. 408-412), Kreyszig (1968, S. 161-162, 350-351) 
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Der empirische Wert der t-Statistik berechnet sich daraus wie folgt: 



(15-16) 




Yi - y 2 _ 12,0-10,0 

s Vy 2 °’ 894 



2,24 



Mit diesem t-Wert ist bei den in unserem Fall vorliegenden 60 Freiheitsgraden eine 
Uberschreitungswahrscheinhchkeit von p = 0,014 verbunden. Approximation durch die 
Normal verteilung ergibt praktisch den gleichen Wert: p = 0,013. Haben wir das Signifi- 
kanzniveau auf a = 0,05 festgelegt, ist der Mittelwertsunterschied also eindeutig in der 
erwarteten Richtung signifikant und die Alternativhypothese - fi 2 > 0 wird akzeptiert. 
Zur gleichen Entscheidung gelangen wir, wenn wir den kritischen Wert der t-Teststatistik 
betrachten: Er liegt flir 60 Freiheitsgrade bei t crit = 1,67 und ist damit deutlich kleiner als 

702 

der empirische t-Wert. 



Mit Hilfe eines Standardfehlers kann auch ein Konfidenzintervall fiir einen unbe- 
kannten Parameter (oder eine Parameterdifferenz) aufgestellt werden. Es spezifiziert 
einen Bereich um eine Stichprobenstatistik, der, vereinfacht gesagt, mit einer be- 
stimmten hohen Wahrscheinlichkeit den entsprechenden tatsachlichen Parameterwert 
enthalt. Bei Approximation durch die Normal verteilung umfasst das 95%-Kon- 
fidenzintervall einen Bereich von knapp zwei Standardfehlern um den Stichproben- 
wert. Aus seiner Lage ist auch eindeutig abzulesen, ob ein entsprechender (zwei- 
seitiger) Test signifikant wird oder nicht. 704 

0 Die kritischen Werte fur a = 0,05 sind bei der Normalverteilung z 0025 =— 1,96 und 
z 0 975 = +l>96. Fiir die Differenz A 12 = u , - u 2 von Mittelwerten und die entsprechende 
Stichprobendifferenz d 12 = M , — M 2 ergeben sich die untere und obere Grenze des 95%- 
Konfidenzintervalls fiir deshalb aus 

(15-17) d 12 -1,96 Syj_y 2 ur >d d 12 +1,96 s ? y • 

Umfasst dieses Konfidenzintervall nicht den Wert Null, ist die Mittelwertsdifferenz in 
einem zweiseitigen Test auf dem 5%-Niveau signifikant. 



15.2.3 Voraussetzungen und Annahmen 

Wie wir im vorangegangenen Abschnitt gesehen haben, miissen bestimmte 
Annahmen gemacht werden, um mathematisch beweisen zu konnen, dass ein 
empirischer t-Wert unter Gliltigkeit der exakten Nullhypothese eine t- Verteilung (mit 
nj+ n 2 -2 Freiheitsgraden) hat: 



p-Wert fiir die t-Verteilung aus MS-EXCEL, p-Wert fiir die Normalverteilung und t cr ; t - 
Wert aus Bortz (1999, Tabelle D) und Hays (1994, Table III). 

703 

Bei graphischen Ergebnisdarstellungen wird deshalb haufig um jeden Mittelwert ein 
Bereich von zwei Standardfehlern eingezeichnet (in SPSS als Fehlerbalkendiagramme 
bezeichnet). Ahnlichen Zwecken dienen die Boxplots , die Mediane, Quartile und 
Extremwerte enthalten. 

704 zu Interpretation und Anwendung: Brandstatter (1999), Cohen (1994), Harlow, Mulaik 
& Steiger (1977), Hays (1994, S. 191-195) 
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1. die beobachteten Werte der abhangigen Variablen sind voneinander unabhangige 
Realisationen zweier Zufallsvariablen, 

2. die Zufallsvariablen sind in beiden Populationsgruppen normal verteilt und 

3. die Varianzen dieser beiden Verteilungen sind gleich (homogen). 

Entsprechende Annahmen miissen beispielsweise auch fur die F-Tests der Varianz-, 
Regressions- und Kovarianzanalysen getroffen werden. Allgemein bezeichnet man 
Testverfahren, die auf derartigen Annahmen liber Normal verteilung und Varianz- 
homogenitat beruhen, als parametrische Verfahren. Diese Voraussetzungen sind 
keine inhaltlich-psychologischen Annahmen, sondern statistische Hilfstheorien. Sie 
konnen als Hilfstheorien (oder genauer: Theorie-Elemente) mit empirischem Gehalt 
interpretiert werden. 

Hilfstheorien mit empirischem Gehalt 

Die vorliegenden Datenwerte konnen dann als unabhangige Realisationen der 
gleichen Zufallsvariablen betrachtet werden, wenn die entsprechenden Merkmals- 
trager eine Zufallsstichprobe aus der gleichen Population darstellen. 706 In diesem 
Fall konnen die iibrigen Voraussetzungen eines parametrischen Testverfahrens als 
Annahmen iiber die tatsachliche Verteilung der betrachteten Variablen in der 
tatsachlich existierenden Population interpretiert werden. Sie konnen an Hand von 
Daten empirisch uberpriift werden und sich dabei als unzutreffend herausstellen. Sie 
entsprechen damit einer Hilfstheorie mit empirischem Gehalt. 

0 Es soli die Hypothese geprtift werden, dass Studierende beider Geschlechter in den drei 
Studienfachern Agrarwissenschaften, Betriebswirtschaftslehre und Biologie sich nicht in 
ihrer Zufriedenheit mit den Studieninhalten, mit den Studienbedingungen und mit der 
Bewaltigung der Studienbelastungen unterscheiden. 707 Zu den statistischen Voraus- 
setzungen fur die Validitat einer multivariaten Varianzanalyse gehort, dass die drei 
abhangigen Variablen in den sechs interessierenden Populationen multivariat normal- 
verteilt sind. Diese Annahme ist empirisch gehaltvoll, da sie im Prinzip fur die Popula- 
tionen der zur Zeit in Deutschland immatrikulierten mannlichen und weiblichen Studie- 
renden dieser drei Facher uberpriift werden kann. 709 



705 

Im Rahmen des Allgemeinen linearen Modells (GLM), das den Varianz- und Regres- 
sionsanalysen zugrunde liegt, entspricht dies Annahmen liber die Verteilung der Fehler- 
komponenten (Bortz, 1999, S. 274; Hays, 1994, S. 390). 

706 zur genaueren Formulierung: Rasch (1995, S. 238) 

707 erfasst z.B. durch drei Skalen mit jeweils drei Items (Westermann et al., 1996) 

708 

Bei groBen und gleichmachtigen Stichproben ist das Verfahren relativ robust gegeniiber 
Abweichungen von diesen Voraussetzungen (Bortz, 1999, S. 576; Stevens, 1992, S. 
238). 

709 Praktisch zu liberprlifen sind derartige Hilfstheorien nicht an der Population, sondern 
nur an (zufalligen) Stichproben und mit Hilfe statistischer Verfahren (z.B. Chi-Quadrat- 
Anpassungstest, siehe Bortz, 1999, S. 160-161). 





Signifikanztestvaliditat 



333 



Sind die Voraussetzungen der Normalverteilung und Varianzhomogenitat nicht 

erfullt, unterscheidet sich die tatsachliche Verteilung der empirischen Teststatistik 

(z.B. t emp ) mehr oder minder stark von der Stichprobenkennwerte- oder Test- 

verteilung (z.B. der t- Verteilung mit n , + n j —2 FG), die bei der Berechnung der 
• • 

Uberschreitungswahrscheinlichkeit p (bzw. der kritischen Werte t crit ) zugrunde gelegt 
wird. Die tatsachlichen Wahrscheinlichkeiten ftir Fehler 1. und 2. Art konnen sich 
deshalb von den nominellen Fehlerwahrscheinlichkeiten a und (3 unterscheiden, die 
bei der Entscheidung vorausgesetzt werden. 

Empirische Uberprufung von statistischen Annahmen 

In etlichen Statistikbuchern wird empfohlen, vor der Durchfuhrung von statistischen 
Tests mit Hilfe anderer statistischer Tests zu iiberprufen, ob die Verteilungs- 
voraussetzungen fur den interessierenden Test erfullt sind. Bevor beispielsweise die 
Gleichheit von Erwartungswerten mit einem t-Test uberpriift wird, soil also gepriift 
werden, ob die Zufallsvariable in den beiden Populationen normalverteilt ist und ob 
die Varianzen homogen sind. Aus verschiedenen Griinden sollte man dieser 
Empfehlung jedoch nicht Folge leisten. 

• Die ublichen t- und F-Tests sind auBerordentlich robust : Nach den Ergebnissen 
von Computersimulationen werden ihre Ergebnisse durch moderate Abweichun- 
gen von den Annahmen nur wenig beeinflusst, insbesondere wenn die Fallzahlen 
in den Untersuchungsbedingungen ungefahr gleich groB sind. 710 

• Die ublichen t- und F-Tests sind auch relativ effizient. Sind ihre Verteilungs- 
annahmen erfullt, hat kein anderer Test eine hohere Teststarke. Auch bei 
Abweichungen von den Annahmen ist ihre Teststarke oft nicht kleiner als die der 
entsprechenden Rangtests. Sie kann allerdings dann stark absinken, wenn die 

711 

Daten sehr deutliche AusreiBer enthalten. 

• Wenn die Untersuchungsgruppen klein sind, konnen Abweichungen von den 
Annahmen zwar unter ungtinstigen Umstanden merkliche Auswirkungen auf die 
Ergebnisse haben. Die statistischen Tests dieser Annahmen haben dann aber nur 
eine sehr geringe Teststarke, sie entdecken Abweichungen also meist nicht. 712 

• Wenn die Untersuchungsgruppen groB sind, werden die Tests auf Normal- 
verteilung und Varianzgleichheit leicht signifikant. Nach dem Zentralen 



710 



711 

712 



zusammenfassend: Hager, Ltibbeke & Hiibner (1983), Judd, McClelland & Culhane 
(1995, S. 452-555), Keppel (1991, S. 97-99, 105-108), Sawilowsky & Blair (1992), 
Stevens (1990, S. 41-43), Winer et al. (1991, S. 100-110). Die ermittelten p-Werte 
konnen allerdings von den tatsachlichen dann deutlich abweichen, wenn die Varianzen 
extrem heterogen sind, wenn die GruppengroBen sich sehr unterscheiden oder wenn 
zwei Annahmen gleichzeitig verletzt sind. 

Marascuilo & McSweeney (1977), Zimmerman & Zumbo (1993), Wilcox (1995, S. 54- 
58) 

Wilcox (1995, S. 67) 
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Grenzwertsatz 713 sind die Auswirkungen von Verletzungen der Verteilungs- 
annahmen aber um so geringer, je groBer die Zahl der Stichprobenelemente ist. 
Unabhangig von der Verteilung, die die abhangige Variable Y in der Population 
hat, nahern sich die Verteilungen der Stichprobenmittelwerte und ihrer 
Differenzen damit jeweils einer Normal verteilung an. Fiir praktische Zwecke ist 
die Naherung dann ausreichend genau, wenn die Fallzahl insgesamt mindestens 
30 bis 40 betragt. 714 

Obwohl t- und F-Tests parametrische Testverfahren sind, konnen sie also ohne 
weiteres auch dann angewendet werden, wenn die Populationsverteilung unbekannt, 
nicht-normal oder varianzheterogen sind. Die Untersuchungsgruppen sollten aber 
stets moglichst groB und von gleichem Umfang sein. AuBerdem sollte man Entschei- 
dungen tiber empirische Flypothesen nur vorsichtig treffen, wenn p-Werte relativ 
dicht am Signifikanzniveau a liegen. 

In den meisten psychologischen Untersuchungen lassen sich die Annahmen iiber 
Populationsverteilungen aber gar nicht sinnvoll interpretieren und tiberprufen, weil 
es weder reale Populationen noch Zufallsstichproben daraus gibt. 

15.2.4 Forschung ohne Zufallsstichproben 

In Lehrbuchern der angewandten Statistik wird ublicherweise zwischen deskriptiver 
(beschreibender) und inferentieller (schlussfolgernder) Statistik unterschieden. 
Statistische Parameterschatzungen und Signifikanztests werden dabei der Inferenz- 
statistik zugeordnet. Sie sollen dazu dienen, die Stichprobenergebnisse auf die 
Population zu verallgemeinern. 

0 In der Markt-, Meinungs- und Wahlforschung dienen Untersuchungen mit Zufallsstich- 
proben dazu, Aussagen iiber die Verhaltnisse in den entsprechenden Populationen zu 
machen: z.B. iiber die Ausstattungspraferenzen aller moglichen Kaufer eines Mittel- 
klasseautos oder iiber die Stimmabsichten aller Wahlberechtigten. 

Diese Anwendung entspricht genau den statistischen Populationsmodellen, die bei 
der Ableitung der Testverteilungen zugrunde gelegt werden: Wenn die Unter- 
suchungseinheiten zufallige Stichproben aus zwei interessierenden Populationen 
sind, konnen die an ihnen beobachteten Werte ohne Probleme, wie bei der Ableitung 
der Stichprobenkennwerte- Verteilung vorausgesetzt, als unabhangige Realisationen 
von zwei (normalverteilten) Zufallsvariablen betrachtet werden. Diese tibliche 
populationsbasierte Interpretation statistischer Tests verfiihrt dazu, die Bedeutung 
von Zufallsstichproben zu tiberschatzen. 715 



Bortz (1999, S. 93), Hays (1994, Kap. 6.7), mathematische Formulierungen und 
Beweise: Fisz (1970, S. 234-241), Rasch (1995, S. 177) 

Bortz (1999, S. 93-94), Hays (1994, S. 316) 

Bredenkamp (1972, S. 14-20), Hager & Westermann (1983a, S. 119), Frick (1998) 
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Merkmale von Zufallsstichproben 

Eine Zufallsstichprobe liegt dann vor, wenn jedes Element der Population die gleiche 

n i z 

Chance hat, als Element der Stichprobe ausgewahlt zu werden. 

0 Um eine Zufallsstichprobe der GroBe n aus der Population der am heutigen Tage in 
Deutschland immatrikulierten Betriebswirtschaftsstudenten zu ziehen, kann man in 
mehreren Schritten vorgehen. Zunachst wird bei alien Universitaten die Zahl der jeweils 
Immatrikulierten ermittelt: in Kiel, N 2 in Greifswald, N 3 in Hamburg usw. Diese 

werden dann in hypothetischer Weise durchnummeriert. Kiel bekommt die Platze 1 bis 
Ni, Greifswald Ni+1 bis N 1 +N 2 usw. AnschlieBend werden n Zufallszahlen bestimmt (je 
nach Gesamtzahl der Immatrikulierten ftinf- oder sechsstellige). Bei jeder Zufallszahl 
wird festgestellt, auf welche Universitat sie entfallt. Innerhalb dieser Universitat kann 
dann jeweils ein Betriebswirtschaftstudent zufallig ausgewahlt werden. 

Verallgemeinerungen von Stichproben auf Populationen sind keine deduktiven 
Ableitungen, die zu sicher wahren Ergebnissen ftihren. Sie sind vielmehr gehalts- 
erweiternde, induktive Argumente (siehe oben Kapitel 7). Ihre Berechtigung ist unter 
sonst gleichen Bedingungen umso hoher, je unverzerrter die untersuchte Stichprobe 
ist, das heiBt je geringer die statistische Assoziation zwischen den betrachteten 
abhangigen und unabhangigen Variablen einerseits und der Auswahl der Stichprobe 
aus der Population andererseits ist. Auch nicht-zufallige Stichproben konnen 
hinreichend unverzerrt sein. Je unverzerrter eine Stichprobe ist, desto geringer ist die 
Gefahr, dass die Verteilungen der interessierenden Variablen in der Stichprobe 
systematisch von den Verteilungen in der Population abweichen, eine Verall- 
gemeinerung von der Stichprobe auf die Population also zu falschen Ergebnissen 
ftihrt. 

0 Soil eine Aussage liber die Studienzufriedenheit deutscher Betriebswirtschaftsstudenten 
gemacht werden und befragt man dazu nur die 15 Teilnehmer an einem freiwilligen 
Trainingsseminar zur psychologischen Gesprachsflihrung im betrieblichen Alltag, werden 
sich vermutlich Zufriedenheitswerte zeigen, die systematisch von den mittleren Werten 
der Population abweichen. 

In der grundlagenwissenschaftlichen psychologischen Forschung und insbesondere 
in allgemeinpsychologischen Experimenten werden fast nie Zufallsstichproben 
verwendet. Dieser Verzicht hat zunachst einmal praktische Griinde. Es gelingt kaum, 
eine aus den Einwohnern zufallig ausgewahlte Stichprobe (auch nur einigermaBen) 
vollstandig dazu zu bewegen, an einem Experiment in einem Psychologischen 



Bortz (1999, S. 87), Hays (1994, S. 53). Diese tibliche Definition einer Zufallsstich- 
probe ist nur fur endliche Populationen sinnvoll anwendbar, denn bei unendlichen 
Populationen ist die Wahrscheinlichkeit, dass ein bestimmtes Element gezogen wird, 
stets gleich Null. Eine Zufallsstichprobe aus einer unendlichen Grundgesamtheit liegt 
vor, wenn die interessierende Variable fur alle Stichprobenelemente die gleiche Vertei- 
lungsfunktion hat (Rasch, 1995, S. 238). 
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Institut teilzunehmen. Psychologische Experimente werden vielmehr meist mit 
Personen durchgefuhrt, die sich aus bestimmten Griinden zur Teilnahme bereit 
erklaren: weil sie fur ihr Psychologie-Vordiplom “Versuchspersonenstunden” 
benotigen, weil sie dem Versuchsleiter einen Gefallen tun wollen, weil sie etwas 
Geld verdienen wollen, weil sie etwas liber sich selbst zu erfahren hoffen usf. 

Wissenschaftstheoretische Begriindungen 

Der Verzicht auf Zufallsstichproben ist auch konzeptuell gut zu begrlinden. Die 

psychologische Forschung ist in der Regel gar nicht daran interessiert, Aussagen 

liber die Eigenschaften von Populationen abzuleiten oder zu prlifen. Sie ist vielmehr 

an den kausalen Zusammenhangen und Prozessen interessiert, die innerhalb 

einzelner Individuen oder Gruppen ablaufen. 

Wenn kausale Zusammenhangsannahmen experimented iiberpriift werden, 

miissen die Untersuchungspersonen nicht unbedingt Zufallsstichproben aus wohl- 

definierten Populationen sein. In einem Experiment betrachtet man stets nur einen 

von sehr vielen intendierten Anwendungsfallen eines Theorie-Elements. Es wird 

lediglich gepriift, ob diese Theorieform in der betrachteten Anwendungssituation 

giiltig ist (siehe oben Abschnitt 11.7). Experimentelle Ergebnisse beziehen sich also 

zunachst einmal nur auf Ursache-Wirkungs-Zusammenhange fiir die untersuchten 

• • 

Personen und Situationen. Empirische Vermutungen iiber die Ubertragbarkeit der 

Ergebnisse auf andere Personen und Situationen sind induktive Argumente. Ihre 

• • 

Berechtigung hangt vor allem von der Ahnlichkeit der untersuchten und der anderen 

717 

interessierenden Personen ab (siehe oben Abschnitt 4.3). 

Auch die Abgrenzung erfolgreicher und nicht-erfolgreicher Anwendungsbereiche 
von Theorien, die aus strukturalistischer Sicht ein Hauptziel der wissenschaftlichen 
Forschung ist, erfordert keine Zufallsstichproben. Hat sich eine Theorie beispiels- 
weise an Psychologiestudenten bewahrt, kann sie systematisch und sukzessiv fiir 
andere Bevolkerungsgruppen Iiberpriift werden: beispielsweise erst fiir Gymna- 
siasten, dann fiir Berufsschiiler, dann fiir Versicherungsangestellte, dann fiir Alters- 
heimbewohner usw. Bewahrt sich die Theorie bei diesen Personengruppen, wird ihr 
erfolgreicher Anwendungsbereich allmahlich immer weiter ausgedehnt. Bewahrt sich 
die Theorie fiir einige Personengruppen nicht, gilt es in nachfolgenden Unter- 
suchungen, die erfolgreichen und nicht-erfolgreichen Anwendungsbereiche systema- 
tisch zu trennen. 

Bei jeder Priifung einer empirischen Hypothese kommt es vor allem darauf an, die 
interne Validitat und die kausale Interpretierbarkeit der Untersuchung zu 
gewahrleisten. Entscheidend ist dazu vor allem die Randomisierung, d.h. die 
zufallige Zuordnung der Untersuchungseinheiten und Untersuchungsbedingungen 



717 

Wird ein Experiment an einer Zufallsstichprobe durchgefuhrt (wobei die Personen 
auBerdem zufallig auf die Bedingungen verteilt werden), sind die Ergebnisse besser auf 
andere Zufallsstichproben aus der gleichen Population verallgemeinerbar. 
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(siehe Abschnitt 14.3). Die untersuchten Personen miissen dazu keine zufdlligen 
Stichproben aus einer bestimmten Population sein: Die Zufallsauswahl ist keine 
notwendige Bedingung fur die Zufallszuordnung. Die Zufallsauswahl ist auch nicht 
hinreichend fiir eine intern valide Priifung einer Kausalhypothese und kann die 
Zufallszuordnung auf keinen Fall ersetzen. 

Zufallsstichproben sind auch nicht notwendig, wenn man aus kritisch- 
rationalistischer Sicht das Hauptziel der empirischen Forschung darin sieht, Theorien 
und Hypothesen streng zu prlifen und sie gegebenenfalls zu falsifizieren. Die 
Falsifikation erfolgt nicht aus Selbstzweck, sondern um die geprliften Theorien durch 
modifizierte Formen zu ersetzen, die besser mit den Daten vertraglich sind (siehe 
oben Abschnitt 10.2). Da eine psychologische Kausalhypothese fur jedes Individuum 
aus einer bestimmten offenen Personengruppe gelten soli (z.B. fiir alle gesunden 
Erwachsenen aus dem westlichen Kulturkreis, siehe oben Abschnitt 7.1.4), muss sie 
auch fiir jede Gruppe von Personen gelten, fiir zufallig ausgewahlte ebenso wie fiir 
nicht-zufallige. Gilt die Flypothese fiir eine untersuchte Stichprobe nicht, kann sie 
folglich auch nicht, wie intendiert, fiir alle Personen der Population gelten, und sollte 
durch eine bessere ersetzt werden. 

Um eine Hypothese streng zu priifen, kann man sogar Personengruppen bewusst 
so auswahlen, dass es der Hypothese schwer gemacht wird, sich zu bewahren. 

0 Die Hypothese, dass Eltern grammatikalisch richtige Satze ihrer Kinder verstarken (und 
somit das Sprachlernen nach den Prinzipien des operanten Konditionierens ermoglichen), 
wird durch den Befund erschiittert, dass Kinder in Bostoner Oberschichtfamilien vor 
allem fiir Aussagen verstarkt werden, die wahr sind und nicht fiir solche, die syntaktisch 
richtig sind. 718 

Hilfstheorien ohne empirischen Gehalt 

Obwohl in psychologischen Experimenten praktisch keine Zufallsstichproben zu 
finden und keine Aussagen iiber Populationen beabsichtigt sind, werden doch 
standardmaBig Signifikanztests angewendet, die in den Statistiklehrbiichern als 
Verfahren beschrieben werden, um an Hand von Zufallsstichproben Aussagen iiber 
Populationen zu treffen. Dieser Widerspruch ist offensichtlich, wird aber von den 
meisten Statistikern und Psychologen geflissentlich ignoriert. Gliicklicherweise kann 
dieser Widerspruch aufgelost werden: Zum einen durch die Begrlindung von 
Signifikanztests iiber das Permutationsprinzip, die im folgenden Abschnitt beschrie- 
ben wird. Zum anderen kann man gerade verfiigbare Probanden (oder sonstige 
Merkmalstrager) als Zufallsstichproben uminterpretieren. Dafiir gibt es zwei Mog- 
lichkeiten: 719 



Frick (1998, S. 532) 

Freedman & Fane (1983b), Hays (1994, S. 226), Westermann (1987a, S. 122-124), 
Iseler (1997), Reichardt & Gollob (1999, S. 117-118) 
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• Man interpretiert die Menge der N Untersuchungseinheiten als Zufallsstichprobe 
aus einer endlichen Population vom Umfang N, die genau gleich der 
Untersuchungsgruppe ist. 

• Man interpretiert die Untersuchungseinheiten als Zufallsstichprobe aus einer 
hypothetischen Population, die all die Einheiten umfasst, die man mit gleichen 
Wahrscheinlichkeiten fur diesen Versuch hatte auswahlen konnen. 

Damit ist der Signifikanztest keine Vorgehensweise mehr, um Aussagen zu prtifen, 
die sich auf eine reale Population beziehen, die unabhangig von der jeweiligen 
Untersuchung existiert und interessiert. Auch die Frage, inwieweit die Verteilungs- 
annahmen erfullt sind, die diesem Test zugrunde liegen, ist dann keine Frage mehr, 
die prinzipiell empirisch entscheidbar ist. Die Annahmen des statistischen Tests 
entsprechen einer Hilfstheorie ohne empirischen Gehalt. Der Test selber ist ein 
Verfahren zur Uberpriifung von Hypothesen iiber Gleichheit bzw. Unterschiedlich- 
keit von Gruppen und Mittelwerten, die sich ausschlieBlich auf die untersuchten 
Falle beziehen. 720 Er entspricht damit den Permutationstests, die im folgenden 
Kapitel besprochen werden. 



15.3 Signifikanztests als Permutationstests 

Die Anwendung von Signifikanztests kann ohne Zufallsstichproben und ohne 
Annahmen liber Populationsverteilungen gerechtfertigt werden, weil Signifikanztests 
auch als Permutationstests begriindet werden konnen. 

Das Prinzip und die Anwendung von Permutationstests wird zunachst am Beispiel 
eines einfachen Tests fur den Vergleich von zwei unabhangigen Gruppen veran- 
schaulicht (Kapitel 15.3.1) und anschlieBend in etwas allgemeinerer Form erlautert 
(Kapitel 15.3.2). Die tiblichen Rangtests sind entweder Permutationstests oder 
Annaherungen an sie (Kapitel 15.3.3). Methodologisch viel wichtiger ist aber, dass 
auch die iiblichen parametrischen Tests Approximationen an Permutationstests sind 
(Kapitel 15.3.4). Sie sind deshalb auch dann anwendbar, wenn keine Zufalls- 
stichprobe vorliegt und keine Annahmen iiber Populationsverteilungen gemacht 
werden konnen (Kapitel 15. 3. 5). 721 



7 °° Der t-Test ist unter den iiblichen Bedingungen tatsachlich ein (konservativer) Test der 
mittleren Behandlungseffekte in zwei Untersuchungsgruppen (Reichardt & Gollob, 
1999). 

721 

Die folgenden Darstellungen beruhen vor allem auf dem ausgezeichneten Lehrbuch der 
nicht-parametrischen Statistik von Marascuilo & McSweeney (1977), den einftihrenden 
Monographien von Edgington (1995) und Good (1994) sowie der sehr fundierten 
Dissertation von Willmes (1987). 
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15.3.1 Beispiel fur den Vergleich von zwei Gruppen 

Das Prinzip der Permutationstests soil an einem typischen, einfachen Experiment 
verdeutlicht werden. Die Probanden sind zwei Bedingungen (Auspragungen) A| und 
A 2 zufallig zugewiesen (randomisiert) worden. Aus der wissenschaftlichen und der 
empirischen Hypothese ergibt sich die empirische Vorhersage y 2 > y, . 

0 In Anlehnung an Frey und Irle lassen wir Studenten freiwillig und offentlich gegen die 
Einfuhrung einer elternunabhangigen Studienforderung argumentieren, obwohl sie ganz 
iiberwiegend dafiir sind. Danach erfassen wird ihre Einstellung zu dieser Studien- 
forderung, indem wir sie sich selbst auf einer Skala von -100 (“absolut dagegen”) bis 
+100 (“absolut dafiir”) einschatzen lassen. Nach der Dissonanztheorie fur Forced 
Compliance erwarten wir eine weniger positive Einstellung bei einer geringen Belohnung 
(Ai) als bei einer hohen Belohnung (A 2 ). 

Um die Rechnungen iibersichtlich zu halten, nehmen wir an, dass das Experiment 
mit nur 10 Personen durchgeflihrt worden ist, vier in der Gruppe A b sechs in A 2 . 
Tabelle 15.1 enthalt mogliche empirische Ergebnisse. 722 



Tabelle 15.1: Fiktive empirische Ergebnisse 



A, 


A 2 


39 


36 


42 


55 


17 


48 


40 


61 




54 




64 


y t = 34,50 


y 2 = 53,00 


si = 11,73 


s 2 = 10,04 



tiblicherweise werden zwei unabhangige Gruppen durch einen t-Test verglichen. 



0 Die gemeinsame Standardabweichung nach (15-11) betragt s = 10,7 , der Standardfehler 
der Mittelwertsdifferenz (15-12) ist s y y , = 6,9. Daraus ergibt sich der empirische Wert 
der t-Statistik nach (15-13): t emp = 2,68 . 

Dieser parametrische Test beruht auf der Annahme, dass die erhaltenen Daten 
zufallige Stichproben aus normalverteilten und varianzgleichen Populationen sind. 
Bei Permutationstests sind diese Annahmen unnotig, denn sie betrachten nur die in 
der konkreten Untersuchung erhaltenen N Werte der abhangigen Variablen Y und 
ihre moglichen Aufteilungen auf die beiden Untersuchungsgruppen. 723 



722 

Die Zahlenwerte stammen von Marascuilo & McSweeney (1977, S. 265). 

723 

Der im Folgenden erlauterte Test wurde von R. A. Fisher und E. J. G. Pitman ent- 
wickelt. 
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Tabelle 15.2: Mogliche Permutationen und Mittelwertsstatistiken 



Gruppe A! 


Gruppe A 2 


Yi 


y 2 


y 2 -yi 


t 


17 


36 


39 


40 


42 


48 


54 


55 


61 


64 


33,00 


54,00 


21,00 


3,53 


17 


36 


39 


42 


40 


48 


54 


55 


61 


64 


33,50 


53,67 


20,17 


3,20 


17 


36 


40 


42 


39 


48 


54 


55 


61 


64 


33,75 


53,50 


19,75 


3,06 


17 


39 


40 


42 


36 


48 


54 


55 


61 


64 


34,50 


53,00 


18,50 


2,68 


17 


36 


39 


48 


40 


42 


54 


55 


61 


64 


35,00 


52,67 


17,67 


2,46 


17 


36 


40 


48 


39 


42 


54 


55 


61 


64 


35,25 


52,50 


17,25 


2,36 


17 


36 


39 


54 


40 


42 


48 


55 


61 


64 


36,50 


51,67 


15,17 


1,93 


• • • 
36 


• • • 
39 


• • • 
48 


• • • 
61 


• • • 
17 


• • • 
40 


• • • 
42 


• • • 
54 


• • • 
55 


• • • 
64 


• • • 

46,00 


• • • 

45,33 


• • • 

-0,67 


• • • 

-0,07 


• • • 
48 


• • • 
55 


• • • 
61 


• • • 
64 


• • • 
17 


• • • 
36 


• • • 
39 


• • • 
40 


• • • 
42 


• • • 
54 


• • • 

57,00 


• • • 

38,00 


• • • 

-19,00 


• • • 

-2,82 


54 


55 


61 


64 


17 


36 


39 


40 


42 


48 


58,50 


37,00 


-21,50 


-3,76 



Die Durchfiihrung eines Permutationstests fur unsere Beispieldaten wird an der 
Tabelle 15.2 demonstriert. Sie enthalt in den ersten beiden Spalten (angedeutet) alle 
moglichen Aufteilungen der fiktiven zehn Datenwerte auf die beiden Experimen- 
talgruppen von vier und sechs Personen. Jede dieser Aufteilungen entspricht einem 
moglichen Ergebnis der experimentellen Randomisierung. Die Anzahl der moglichen 
Aufteilungen ergibt sich aus dem Binomialkoeffizient: 724 



(15-18) 



S+ n 2 A 




'HP 


k 111 ) 




v 4 , 



10 ! 

4!6! 



= 210 . 



Von den “zehn fiber vier” gleich 210 moglichen Aufteilungen sind in der Tabelle nur 
die ersten sieben, die letzten zwei und eine mittlere aufgefiihrt. Die angenommenen 
tatsachlichen Daten aus Tabelle 15.1 erscheinen an vierter Stelle. Fur jede Aufteilung 

795 

sind die Mittelwerte, ihre Differenz und der empirische t-Wert (15-1) berechnet. 
Die Aufteilungen sind nach der GroBe dieser Werte geordnet. Die Rangfolge ist 
unabhangig davon, ob die Mittelwerte, die Differenzen oder der t-Wert betrachtet 

r ~l r ) 

werden. Wir betrachten deshalb im Folgenden nur noch den vertrauten t-Wert. 



724 

Dies entspricht der Anzahl der Moglichkeiten, n : Elemente ohne Zuriicklegen aus n : + 
n 2 Elementen zu ziehen (Bortz, 1999, S. 60-62; Hays, 1994, Kap. 3.7). Die Menge der 
moglichen Ergebnisse bei einer Auswahl mit Zuriicklegen ist die Grundlage der mit den 
Permutationstests verwandten bootstrap - Techniken (Efron & Tibshirani, 1993; Good, 
1994; Rietz, Rietz & Rudinger, 1997; Sievers, 1990). 

Als Mittelwertsdifferenz wird nicht y 1 - y 2 , sondern y 2 - y 1 verwendet, damit sie bei 
hypothesenkonformen Ergebnissen positiv ist. Diese Differenz wird auch als Zahler der 
t -Statistik verwendet. In SPSS wird dazu die Gruppe mit den hypothesengemaB hoheren 
Werten, hier also A 2 , als die erste definiert. 

V26 

Am einfachsten kann die Rangordnung der Aufteilungen generiert werden, wenn man 
nur die Summe der Werte der kleineren Stichprobe berechnet. 
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Nehmen wir zuerst den Fall an, dass unsere empirische Hypothese zutreffend ist. 
Dann mlissten die Werte der AV Y unter A 2 dazu tendieren, groBer zu sein als die 
Werte der AV unter A|. Bei Gultigkeit unserer empirischen Hypothese sind also 
positive Werte fiir den t-Wert wahrscheinlicher als negative. 

Als zweites gehen wir von dem Fall aus, dass unsere empirische Hypothese 
unzutreffend ist, und zwar in dem Sinne unzutreffend, dass die Werte der AV vollig 
unabhangig von der Gruppeneinteilung in A, und A 2 sind. 

0 Die empirische Hypothese, dass die Forced-Compliance-Elemente der Dissonanztheorie 
fiir die untersuchte Situation gelten, ist in diesem Sinne falsch, wenn die Auspragung der 
Meinung in keinem Zusammenhang mit der Hohe der Belohnung steht. 

Wegen der Randomisierung sind alle moglichen Aufteilungen der Personen auf die 

beiden Gruppen (in einem vorgegebenen Verhaltnis) gleich wahrscheinlich. Wenn 

die Werte der Personen auf der AV nicht von der Bedingung abhangen, unter der sie 

untersucht werden, sind dann auch alle moglichen Aufteilungen der Datenwerte auf 

die beiden Bedingungen gleich wahrscheinlich. In unserem Fall sind also bei Unab- 

hangigkeit von UV und AV alle 210 moglichen Aufteilungen der 10 Datenwerte auf 

die beiden Gruppen (im Verhaltnis 4 zu 6) gleich wahrscheinlich. Die Wahrschein- 

lichkeiten fiir sehr kleine und sehr groBe Werte der Teststatistik t lassen sich damit 

aus der Tabelle 15.2 ermitteln. Sie konnen in der iiblichen Weise die Basis fiir eine 

signifikanzstatistische Entscheidung bilden. 

Die fiktiven Daten in Tabelle 15.1 fiihren zu einem t = 2,68. Unter der Nullhypo- 

these, dass alle moglichen Aufteilungen gleich wahrscheinlich sind, ergibt sich nach 

Tabelle 15.2 nur in vier von 210 Fallen ein Mittelwertsunterschied, der mindestens 

• • 

so groB ist wie der erhaltene. Die Uberschreitungswahrscheinlichkeit fiir dieses 
Ergebnis betragt also p = 4/210 = 0,019. 

In unserem Beispiel ist der Permutationstest also auf dem 5%-Niveau signifikant, 
nicht aber auf dem 1%-Niveau. Haben wir vorher a = 0,05 festgelegt, lehnen wir die 
Nullhypothese ab, dass die Aufteilungen gleich wahrscheinlich sind. Wir nehmen 
damit an, dass die Werte der AV Y nicht unabhangig von der Auspragung der UV A 
sind, sondern die Werte in der Bedingung A 2 tendenziell (oder im Mittel) groBer sind 
als unter A,. Dies spricht fiir die Gultigkeit der empirischen Hypothese. 

15.3.2 Grundlagen und Hypothesen von Permutationstests 

Das am Beispiel illustrierte Prinzip eines Permutationstests lasst sich in folgenden 
Punkten zusammenfassen: 

• Bei einem Permutationstest werden nur die in der konkreten Untersuchung 
erhaltenen N Werte der abhangigen Variablen Y betrachtet. 

• Wenn die AV Y von der unabhangigen Variablen A unabhangig ist, sind alle 
moglichen Aufteilungen der N Werte von Y auf die Auspragungen von A gleich 
wahrscheinlich. 
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• Berechnet man den Wert einer geeigneten Teststatistik fur jede dieser moglichen 
Aufteilungen, bekommt man die Verteilung, die diese Teststatistik bei Gultigkeit 
der Nullhypothese hat. 

• • 

• Diese Verteilung dient als Testverteilung, anhand der die Uberschreitungs- 
wahrscheinlichkeiten bestimmt werden. 

• • 

• Gehort zum empirischen Wert der Teststatistik eine Uberschreitungs- 
wahrscheinlichkeit p, die kleiner als das festgesetzte Signifikanzniveau a ist, hat 
man ein Ergebnis erhalten, das unter den Annahmen, die bei der Ableitung dieser 
Verteilung zugrunde gelegt wurden, zwar nicht unmoglich, relativ zu dem 
gewahlten Signifikanzniveau aber unwahrscheinlich ist. 

• Nach der iiblichen Logik des Signifikanztests entscheidet man sich in einem 
solchen “unwahrscheinlichen” Fall daftir, die zugrunde liegende Annahme als 
falsch zu betrachten: Die Nullhypothese der Unabhangigkeit von AV und UV 
wird verworfen, und es wird angenommen, dass die Werte der AV unter der einen 
Auspragung der UV tendenziell hoher sind als unter der oder den anderen. 

Die Prinzipien des exakten Permutationstests lassen sich auf alle wichtigen 
statistischen Fragestellungen anwenden und konnen die iiblichen parametrischen 
Methoden ersetzen: von den t-Tests fur unabhangige und abhangige Messungen liber 
ein- und mehrfaktorielle Varianzanalysen, multiple Vergleiche, Regressions-, 
Korrelations- und Trendanalysen bis hin zu multivariaten Verfahren. 

Nullhypothesen 

Die von Permutationstests gepriiften Hypothesen diirfen nicht vorschnell mit den 
Hypothesen der entsprechenden parametrischen Verfahren gleichgesetzt werden. Die 

gepriifte Nullhypothese ist die Annahme, unter der die Testverteilungen und die 

• • 

Uberschreitungswahrscheinlichkeiten abgeleitet werden: 

• Alle moglichen Aufteilungen der Datenwerte auf die untersuchten Gruppen sind 
gleich wahrscheinlich. 

Diese Gleichwahrscheinlichkeit lasst sich aus allgemeineren Annahmen ableiten: 
dass die zugrunde liegenden Prozesse rein zufallig oder dass die betrachten 
Variablen vollstandig voneinander unabhangig sind. 727 Fur den einfachen Fall eines 
Vergleiches der Werte einer abhangigen Variablen Y unter verschiedenen 
Auspragungen einer unabhangigen Variablen A kann dies auf verschiedene Weisen 
formuliert werden: 

• Die Verteilungen von Y sind unter alien Auspragungen von A gleich. 

• Die Auspragungen von Y sind unabhangig von den Auspragungen von A. 



727 



Wissenschaftliche Hypothesen iiber systematische Wirkungen oder Zusammenhange 
werden gegen diese Zufalligkeits- oder Unabhangigkeitsannahmen getestet (Abelson, 
1995, S. 18-26). 
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• Fur zwei zufallig ausgewahlte Werte Y; und Yj aus zwei Auspragungen A ; und Aj 
gilt mit gleicher Wahrscheinlichkeit Yj > Yj und Yj < Yj- 

Etwas konkretere Formulierungen ergeben sich fur den Fall von Experimenten, in 
denen die Personen den Auspragungen zufallig zugeordnet werden: 

• Die Auspragungen der unabhangigen Variablen A haben bei keiner Unter- 
suchungseinheit eine Wirkung auf die Auspragung der abhangigen Variablen Y. 

• Die Auspragungen der abhangigen Variable Y sind fest mit den Personen 
verbunden und bleiben konstant, wenn die Personen einer anderen Auspragung 
der unabhangigen Variablen A zugeordnet werden. 

Bei einer richtig durchgefiihrten Randomisierung sind alle moglichen Aufteilungen 
der Personen auf die Gruppen gleich wahrscheinlich. Die experimentelle Randomi- 
sierung allein ist aber nicht hinreichend fur die Gleichwahrscheinlichkeit aller 
Aufteilungen der Daten auf die Gruppen. Notwendig ist immer die Annahme der 
Unabhangigkeit der betrachteten Variablen. Permutationstests, bei denen eine 
Randomisierung die Basis fur die Gleichwahrscheinlichkeit aller Aufteilungen der 

798 

Werte auf die Gruppen ist, werden auch als Randomisierungstests bezeichnet. 
Alternativhypothesen 

Die Alternativhypothese eines Permutationstests ist die Negation der Nullhypothese: 

• Die Aufteilungen der Werte der AV auf die Auspragungen der UV sind nicht 
gleich wahrscheinlich. 

Sie ergibt sich aus der Annahme, dass die zugrunde liegenden Prozesse systematised 
wirken oder die betrachteten Variablen voneinander abhangig sind: 

• Die AV ist nicht unabhangig von der UV. 

• Unter verschiedenen Auspragungen der UV ergeben sich unterschiedliche 
Verteilungen der AV. 

• Bei mindestens einer Untersuchungseinheit verandert sich der Wert der AV, wenn 
sie einer anderen Auspragung der UV zugeordnet ist. 

• Bei mindestens einer Untersuchungseinheit hat die UV eine Auswirkung auf den 
Wert der AV . 729 



728 

Da in diesem Fall die experimentelle Randomisierung durch eine statistische Neu- 
Zuordnung erganzt wird, spricht man auch von Re-Randomisierungs-Tests. 

729 Das heiBt es gilt Y u - Y i2 ^ 0 . Entsprechende (fiktive) Unterschiedshypothesen fur ein- 
zelne Untersuchungseinheiten liegen auch parametrischen Tests zugrunde, wenn die 
untersuchten Einheiten keine Zufallsstichprobe sind (Frick, 1998; Reichardt & Gollob, 
1999, S. 118). Da meist von jeder Untersuchungseinheit nur ein Wert der abhangigen 
Variablen unter einer Bedingung erhoben werden kann, ist bei randomisierten Gruppen 
die Differenz der inter-individuellen Mittelwerte y, - y 2 die beste Schatzung fur die 
individuellen Differenzen y n -y i2 (Holland, 1986; Iseler, 1996; Rubin, 1990). 
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Hypothesen iiber Grofienordnungen 

Im Vergleich zu den parametrischen Tests sind die Alternativhypothesen von 
Permutationstests sehr unspezifisch. Durch die Wahl der Teststatistik lasst sich 
allerdings beeinflussen, auf welche Abweichungen von der Nullhypothese der Test 
vor allem anspricht. Dies wird am Beispiel zweier Gruppen deutlich: 

• Mit Mittelwertsdifferenzen, t-Werten und Wertesummen als Teststatistik wird der 
Permutationstest vor allem bei Unterschieden in der zentralen Tendenz 
(Mittelwerte, Mediane usw.) signifikant. 

• Mit dem Quotienten aus den Varianzen der beiden Gruppen wird der Test vor 
allem bei Unterschieden in der Variabilitat (Varianz, Interquartilabstande, 
Spannbreite usw.) signifikant. 

Da diese Statistiken eine Richtungsinformation enthalten, kann man einen 
Permutationstest auch einseitig durchflihren. Verwendet man als Teststatistik 
Wertsummen, Mittelwertsdifferenzen oder t-Werte, bedeutet die Akzeptierung einer 
gerichteten Alternativhypothese ganz allgemein, dass die Werte der AV Y unter der 
einen Bedingung, z.B. A 2 , tendenziell grofier sind als unter der anderen (A t ). Diese 
Aussage soil konkret folgendes bedeuten: Wahlt man zufallig jeweils einen Wert der 
AV aus beiden Bedingungen aus, ist die Wahrscheinlichkeit, dass der Y-Wert aus A 2 
groBer ist als der aus A| hoher als die Wahrscheinlichkeit, dass der Wert aus A| 
groBer ist als der aus A 2 . Dies ist genau dann der Fall, wenn fur die Werte in A 2 ein 
hoherer Platz in der gemeinsamen Rangordnung erwartet wird. Fiir eine 
experimentelle Untersuchung, in der wir den Zusammenhang zwischen A und Y 
kausal interpretieren, bedeutet das inhaltlich ausgedriickt: A 2 hat eine positive 
Wirkung auf Y. 730 

Wenn die Verteilungen in beiden Gruppen symmetrisch sind, sprechen 

Permutationstests mit Wertsummen, Mittelwertsdifferenzen oder t-Werten als 

• • 

Teststatistik ausschlieBlich auf Mittelwertsunterschiede an. Zur Uberpriifung der 
gerichteten Mittelwertsvorhersagen, die sich aus den meisten psychologischen 
Hypothesen ergeben, sind deshalb einseitige Permutationstests sehr gut geeignet. 

0 Fur das Experiment von Frey und Me haben wir im Abschnitt 12.3.2.4 in der 
Dissonanzbedingung EO+ die Vorhersage abgeleitet, dass die Meinung unter 1 DM 
Belohnung weniger positiv ist als unter 8 DM. Fur die Verstarkungsbedingung EO- 
wurde eine gegenteilige Wirkung der Belohnung erwartet. Als Mittelwertsvorhersagen 
ergeben sich daraus y n <y 12 (12-1) und y 2 i>y 22 (12-2). Mit einem einseitigen 
Permutationstest kann uberprtift werden, ob der erwartete Mittelwertsunterschied als 
systematisch oder zufallig zu betrachten ist. 



730 



Cliff (1993a) 
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15.3.3 Rangtests als Permutationstests 

Die in den meisten Statistikbiichern beschriebenen Rangtests arbeiten nicht mit den 
erhaltenen Messwerten, sondern mit ihren Rangen. Bei ihrer Anwendung miissen 
keine Annahmen iiber die Normal verteilung und Varianzhomogenitat gemacht 
werden. Sie gehoren deshalb zu den nicht-parametrischen oder verteilungsfreien 
Tests. Am bekanntesten sind der Mann-Whitney-U-Test fur den Vergleich zweier 
unabhangiger Gruppen, der Wilcoxon-Test fur abhangige Gruppen und der 
Friedman-Test, die sog. Rang-Varianzanalyse fur den Vergleich mehrerer 
Gruppen. Sie beruhen auf dem Prinzip der Permutationstests. 

Beim Rangtest fur unabhangige Gruppen werden die erhaltenen Messwerte aus 
beiden Gruppen in eine gemeinsame Rangordnung gebracht. Dann wird die Summe 
Tj der Range in der kleineren der beiden Gruppen berechnet. 732 Die Verteilung 
dieser Rangsumme iiber alle moglichen Aufteilungen ist dann die Testverteilung. 



Tabelle 15.3: Mogliche Permutationen und Rangstatistiken 



Gruppe A! 


Gruppe A 2 


Ti 


P 


t 


1 


2 


3 


4 


5 


6 


7 


8 


9 


10 


10 


0,005 


3,53 


1 


2 


3 


5 


4 


6 


7 


8 


9 


10 


11 


0,010 


3,20 


1 


2 


4 


5 


3 


6 


7 


8 


9 


10 


12 


0,019 


3,06 


1 


2 


3 


6 


4 


5 


7 


8 


9 


10 


12 


0,019 


2,46 


1 


3 


4 


5 


2 


6 


7 


8 


9 


10 


13 


0,033 


2,68 


1 


2 


4 


6 


3 


5 


7 


8 


9 


10 


13 


0,033 


2,36 


1 


2 


3 


7 


4 


5 


6 


8 


9 


10 


13 


0,033 


1,93 


• • • 
2 


• • • 
3 


• • • 
6 


• • • 
9 


• • • 
1 


• • • 
4 


• • • 
5 


• • • 
7 


• • • 
8 


• • • 
10 


20 


0,381 


• • • 

-0,07 


• • • 
6 


• • • 
8 


• • • 
9 


• • • 
10 


• • • 
1 


• • • 
2 


• • • 

3 


• • • 
4 


• • • 
5 


• • • 
7 


33 


0,995 


• • • 

-2,82 


7 


8 


9 


10 


1 


2 


3 


4 


5 


6 


34 


1,000 


-3,76 



In der Tabelle 15.3 sind die Daten aus Tabelle 15.1 in Range transformiert und nach 

ihrer jeweiligen Rangsumme Tj geordnet. Fur jede Permutation k ist die 
• • 

Uberschreitungswahrscheinlichkeit angegeben, die sich aus Division ihres 
Rangplatzes durch die Gesamtzahl von 210 Permutationen ergibt. Fur unsere 
fiktiven Daten aus Tabelle 15.1 ergibt sich eine Rangsumme von 13 und damit 
bestenfalls der flinfte Platz. Da auch zwei andere Permutationen die gleiche 



77 1 

Darstellungen: Bortz, Lienert & Boehnke (1990), Marascuilo & McSweeney (1977) 

732 

Fur den Rangtest bei zwei unabhangigen Gruppen existieren zwei Teststatistiken: U von 
Mann und Whitney und T (auch W genannt) von Wilcoxon (Marascuilo & McSweeney, 
1977, S. 267-273). Beide Statistiken werden in SPSS berechnet und ftihren zu 
identischen p-Werten. In empirischen Arbeiten wird meist U berichtet, zur Veran- 

schaulichung des Permutationsprinzips ist T besser geeignet. 

733 

Diese p-Werte werden in SPSS als “exakte Signifikanz (1-seitig)” bezeichnet. Sie sind 
fur kleine Stichproben auch tabelliert (Marascuilo & McSweeney, 1977, Tab. A-14). 
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• • 

Rangsumme haben, ergibt sich eine Uberschreitungswahrscheinlichkeit von p = 
7/210 = 0,033. Sie ist groBer als die Uberschreitungswahrscheinlichkeit von 0,019 
fur die urspriinglichen numerischen Daten. Die Entscheidung im Signifikanztest ist 
aber gleich: Die Werte in Gruppe A 2 sind auf dem 5%-Niveau signifikant groBer als 
in A b nicht aber auf dem 1%-Niveau. 

Gegeniiber den exakten Permutationstests haben die exakten Rangtests einen 
unaufhebbaren Nachteil: Sie reduzieren die in den Daten enthaltene Information auf 
Information liber Range. Dadurch wird die Ermittlung der Uberschreitungswahr- 
scheinlichkeiten weniger genau. 

0 Betrachtet man nur die Range der Auspragungen der AV (Tabelle 15.3), hat unser 
fiktives Ergebnis die gleiche Uberschreitungswahrscheinlichkeit wie zwei andere 
mogliche Ergebnisse. Bei den numerischen Auspragungen sind alle Uberschreitungs- 
wahrscheinlichkeiten verschieden (Tabelle 15.2). 

Die Beschrankung auf Range ist sachgerecht, wenn die abhangige Variable kein 
Intervall-, sondern nur Ordinalskalenniveau hat. Ein bestimmtes Skalenniveau ist 
zwar keine Voraussetzung dafiir, dass arithmetische Mittelwerte, Differenzen oder t- 
Werte berechnet und fur die gegebenen Daten interpretiert werden. Auch haben 
Simulationen gezeigt, dass Abweichungen vom Intervallskalenniveau meist keine 
wesentlichen Einfliisse auf die Ergebnisse statistischer Tests haben. Das 
Intervallskalenniveau ist aber notwendig, damit die Iiblichen Mittelwertsvorhersagen 

7^4 

und -hypothesen sinnvoll theoretisch interpretiert werden konnen. 

Die Null- und Alternativhypothesen der Rangtests ergeben sich aus denen der 
Permutationstests. Nach der Nullhypothese sind die Verteilungen und Erwartungs- 
werte der Range in alien Gruppen gleich. Bei einer gerichteten Alternativhypothese 
sind die Range in der einen Gruppe tendenziell groBer als in der anderen. Sind die 
Verteilungen der urspriinglichen Werte symmetrisch, folgen aus diesen Rangunter- 
schieden entsprechende Unterschiede zwischen den arithmetischen Mittelwerten. 735 



734 

Hat die abhangige Variable nur Ordinalskalenniveau, sind zwar Rangordnungen von 
Zahlenwerten interpretierbar, nicht aber numerische Abstande zwischen ihnen. Neben 
den gegebenen Werten sind dann alle anderen Zahlenzuordnungen, die sich durch 
monotone (rangerhaltende) Transformationen ergeben, gleich sinnvolle Operationa- 
lisierungen der interessierenden theoretischen Variablen. Bei einigen dieser auf Ordinal- 
skalenniveau erlaubten Transformationen andern sich die Wahrheits werte von Aussagen 
liber die Gleichheit, Ungleichheit und GroBenordnung von arithmetischen Mittelwerten 
sowie speziell die Werte von t- und F-Statistiken, von standardisierten 
Mittelwertsdifferenzen, Korrelationskoeffizienten und Varianzanteilen. Auf Intervall- 
skalenniveau bleiben sie jedoch konstant. Deshalb sind derartige Aussagen zwar auf 
Intervall-, aber nicht auf Ordinalskalenniveau inhaltlich bedeutsam (siehe im einzelnen 
Cliff, 1993b; Erdfelder & Bredenkamp, 1994; Gaito, 1987; Hager, 1987, S. 121-127; 
Hager & Westermann, 1983a, S. 38-42; Niederee & Mausfeld, 1996; Thomas, 1982; 
Townsend & Ashby, 1984; Westermann, 1987a, S. 188-210). 

735 Marascuilo & McSweeney (1977, S. 268-269) 
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Eine wesentlicher praktischer Vorteil der Rangtests besteht darin, dass sich schon 
fur relativ kleine Gruppen die Verteilungen der Teststatistiken recht gut durch die 

S' 

Normal verteilung oder durch andere bekannte Verteilungen approximieren lassen. 

Die Teststatistik Tj fur den Vergleich von zwei unabhangigen Gruppen beispiels- 
weise ist, falls jede der Stichproben mehr als 10 Falle umfasst, annahernd normal- 
verteilt. 

0 Fur die Daten in Tabelle 15.1 ergibt die Normalverteilungsapproximation zum U-Test 
(die wegen der geringen Fallzahl eigentlich nicht empfehlenswert ist) ein z = 1,92 und 
damit eine Uberschreitungswahrscheinlichkeit von p = 0,027. Auch danach ist der 
Gruppenunterschied also auf dem 5%-, nicht aber auf dem 1%-Niveau signifikant. 

15.3.4 Parametrische Tests als approximative Permutationstests 

Die Hauptschwierigkeit von exakten Permutationstests besteht darin, dass alle (oder 

zumindest alle extremeren) Aufteilungen generiert und fiir jede von ihnen eine 

geeignete Teststatistik berechnet werden muss. Meist ist dies rechnerisch sehr 

aufwendig. Fiir alle genannten Verfahren gibt es relativ einfache Programme, die den 

Anwendern die Arbeit abnehmen. In SPSS und in anderen Programmpaketen zur 

Statistik sind diese Verfahren jedoch nicht enthalten. 

• • 

Die Berechnung von exakten Uberschreitungswahrscheinlichkeiten anhand aller 
moglichen Permutationen der Daten ist jedoch in der Regel gar nicht notwendig: 
Unter normalen Umstanden konnen die Ergebnisse exakter Permutationstests sehr 
gut durch die iiblichen parametrischen Verfahren angenahert werden. 

Vor allem die Verteilung der iiblichen t-Statistik iiber alle moglichen 
Aufteilungen der Daten auf zwei Gruppen kann fiir groBere Fallzahlen gut durch die 
tiblicherweise verwendete t- Verteilung approximiert werden. Der parametrische t- 
Test kann deshalb als Approximation eines Permutationstests interpretiert werden. 

9 Fiir die fiktiven Daten aus Tabelle 15.1 betrug der empirische Wert der Teststatistik t emp 
= 2,68. Fiihrt man in der iiblichen Weise einen t-Test mit 8 Freiheitsgraden durch, betragt 
die einseitige Uberschreitungswahrscheinlichkeit p = 0,014. Dieser iiber die t-Verteilung 
ermittelte parametrische p-Wert entspricht recht genau der exakten Uber- 
schreitungswahrscheinlichkeit von 0,019, die wir aus der Menge der moglichen 
Permutationen in Tabelle 15.2 ermittelt haben. 

Dementsprechend konnen auch andere parametrische Tests als Approximationen von 
Permutationstests verwendet werden, insbesondere die F-Tests der Haupteffekte in 
einfaktoriellen und den meisten mehrfaktoriellen Varianzanalysen. 738 



Marascuilo & McSweeney (1977, S. 267), Good (1994, S. 161-162), Bortz, Lienert & 
Boehnke (1990, S. 297) 

Edgington (1995), Good (1994) 

Bradbury (1987), Bredenkamp (1980, S. 21), Edgington (1995, S. 12), Still & White 
(1981), Willmes (1987, S. 2-3, 288-292) 
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Die aus den moglichen Permutationen der Daten und die aus den t- und F- 

Verteilungen berechneten p-Werte stimmen dabei in vielen Fallen hinreichend 

uberein. Mitunter gibt es aber auch bemerkenswerte Abweichungen. Ihre GroBe und 

ihre Richtung hangen von verschiedenen Faktoren ab: von der Anzahl der 

Untersuchungseinheiten, von der Gleichheit der GruppengroBen und von der Form 

der Verteilung der Werte in den Gruppen. Die Bedeutung eventueller Abweichungen 

darf aber nicht uberbewertet werden: Auch die aus den t- und F-Verteilungen 

• • 

berechneten Uberschreitungswahrscheinlichkeiten konnen von den tatsachlichen 
Werten abweichen, wenn die Annahme der Normal verteilung und Varianzgleichheit 
der Verteilungen in den Populationen nicht zutreffend ist. 

Es gibt jedoch auch einige statistische Verfahren, fur die es keine entsprechenden 
Permutationstests gibt, die also auch nicht als Approximationen von Permutations- 
tests interpretierbar sind. Dazu gehoren beispielsweise die Interaktionstests in 
Varianzanalysen ohne Messwiederholung. Fur sie muss man streng genommen 
Annahmen iiber die Verteilung von Variablen in unbekannten Populationen treffen. 
Diese Voraussetzungen konnen jedoch auch als Theorie-Elemente ohne empirischen 
Gehalt interpretiert werden, so dass es unerheblich ist, ob sie tatsachlich empirisch 
erfiillt sind. 

15.3.5 Generelle Anwendbarkeit von Permutationstests 

• • 

Die bisherigen Uberlegungen zu den Permutationstests bezogen sich auf den Fall von 
Experimenten, in denen die Personen den Gruppen zufallig zugeordnet wurden. Die 
Menge aller moglichen Aufteilungen der Daten auf die Untersuchungsbedingungen 
entspricht in diesem Fall den moglichen Ausgangen der experimentellen Randomi- 
sierungsprozedur. 

Viele psychologische Fragestellungen beziehen sich aber nicht auf kausale, 
sondern auf assoziative Gesetzesannahmen (siehe oben Kapitel 7.2.7). Die 
entsprechenden empirischen Untersuchungen sind nicht experimentell, sondern 
korrelativ. Sie priifen nicht die Wirkung unterschiedlicher Behandlungsbedingungen, 
denen Personen zufallig zugeordnet werden konnen, sondern vergleichen die 
Auspragungen der interessierenden abhangigen Variablen fur verschiedene vor- 
gegebene Auspragungen der unabhangigen Variablen. 

0 In einer Untersuchung zum Vergleich der Studienzufriedenheit verschiedener Facher 
werden n, Studierende der Agrarwissenschaften, n 2 Studierende der Betriebswirt- 
schaftslehre, n 3 Studierende der Biologie usw. untersucht. Die Personen werden diesen 
Studienfachern nattirlich nicht vom Forscher zufallig zugeordnet. Die Zuordnung der 
Personen zu den Studienfachern steht vielmehr vor der Untersuchung fest. 



739 



Willmes (1987, S. 12, 14, 299) 
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Auch in derartigen nicht-experimentellen, korrelativen Untersuchungen konnen 
Permutationstests angewendet werden. 740 Die untersuchten Personen (oder 
Merkmalstrager) miissen allerdings zufallige oder hinreichend unverzerrte 
Stichproben aus der interessierenden Population sein. Sind zwei Variablen in der 
Population statistisch unabhangig, dann sind alle moglichen Aufteilungen der 
beobachteten Werte gleich wahrscheinlich. 741 

0 Wenn wir die psychologische Hypothese haben, dass die Studienzufriedenheit von 
Studierenden der Biologie und der Betriebswirtschaftslehre gleich ist, folgt daraus die 
statistische Hypothese, dass die Variable “Studienfach” (mit den Fachern Biologie und 
Betriebswirtschaft als Auspragungen) und die Variable “Studienzufriedenheit” unab- 
hangig sind. Wenn diese Unabhangigkeit besteht, sind in einer unverzerrten Stichprobe 

alle moglichen Aufteilungen der empirisch erhaltenen Werte der abhangigen Variablen 

742 

“Studienzufriedenheit” auf die beiden Gruppen gleich wahrscheinlich. 

Eine gerichtete Alternative zur Annahme der Gleichwahrscheinlichkeit aller 
Permutationen der Daten lasst sich aus alien wissenschaftlichen Hypothese ableiten, 
die die Richtung von Assoziationen oder Mittelwertsunterschieden spezifizieren. 

0 Aus der psychologischen Hypothese, dass die Studienzufriedenheit in Biologie hoher ist 
als in Betriebswirtschaftslehre (z.B. weil das Fach Biologie aus der Schule besser bekannt 
ist und die Studienfachwahl deshalb fundierter erfolgen konnte), folgt die Vorhersage, 
dass die Variable “Studienzufriedenheit” in der Gruppe der Biologiestudierenden 
“tendenziell groGer” ist als bei den Betriebswirtschaftsstudierenden. 

Konsequenzen 

Die exakten und approximativen Permutationstests wurden hier so ausflihrlich 
dargestellt, um deutlich zu machen, dass man bei dieser Begriindung der Anwendung 
von Signifikanztests in keiner Weise iiber das konkrete betrachtete Experiment und 
die tatsachlich erhaltenen Werte der AV hinausgehen muss: Notwendige 

Voraussetzung fur die Durchflihrbarkeit von Signifikanztests ist vielmehr nur, dass 
man eine Verteilung einer Stichprobenstatistik als Testverteilung vorliegen hat. Wie 
wir im vorausgegangenen Kapitel 15.2 gesehen haben, werden Testverteilungen 
Iiblicherweise als Verteilungen der betreffenden Statistik bei unendlich vielen 
Zufallsstichproben des gleichen Umfangs aus der gleichen Population interpretiert. 



Edgington (1995, S. 337), Freedman & Lane (1983a, 1983b), Marascuilo & McSweeney 
(1977, S. 276-277), Willmes (1987, S. 103-105), dagegen, allerdings unbegriindet: 
Krauth (1986b, S. 192) 

741 Zwei Variablen sind genau dann statistisch (oder stochastisch) unabhangig, wenn die 
(bedingten) Verteilungen der einen Variablen unter alien Auspragungen der anderen 
Variablen gleich sind (Fisz, 1970, S. 74). 

742 

Auch wenn die Gruppierungsvariable A mehr als zwei Auspragungen hat, sind alle 
moglichen Aufteilungen der Werte der abhangigen Variablen Y in k > 2 Gruppen gleich 
wahrscheinlich, falls Y und A unabhangig sind. 
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Wie die bisherigen Uberlegungen in diesem Kapitel zeigen, kann man aber auch 
Testverteilungen generieren, indem man alle moglichen Zufallsaufteilungen eines 
vorliegenden Datensatzes betrachtet. 

Liegen keine Zufallsstichproben vor, sind allerdings auch alle Riickschliisse von 
den empirischen Ergebnissen auf Verteilungen und Parameterwerte in einer 
bestimmten realen Population mit groBerer Unsicherheit behaftet. Ohne Zufalls- 
stichproben sind Signifikanztests Strategien zur Generierung von Kriterien, um zu 
entscheiden, ob empirische Ergebnisse den Vorhersagen entsprechen, die aus den 
wissenschaftlichen Hypothesen abgeleitet worden sind. 

15.3.6 Signifikanztests als Entscheidungsstrategien 

In den groBten Teilen der psychologischen Forschung werden keine 
Zufallsstichproben gezogen und keine Aussagen liber Populationen angestrebt. 
Vielmehr werden empirische und insbesondere experimentelle Untersuchungen 
durchgeflihrt, um die Gliltigkeit wissenschaftlicher Theorien, Modellvorstellungen 
und Erklarungen flir konkrete und spezifische Situationen und Personen zu 
Iiberpriifen. Dazu werden aus der interessierenden wissenschaftlichen Hypothese 
konkrete Vorhersagen liber empirisch zu erwartende Ergebnisse abgeleitet. Signifi- 
kanztests werden dann als Strategic eingesetzt, um zu entscheiden, ob die erhaltenen 
Daten systematisch von diesen Vorhersagen abweichen oder nicht. 

Derartige Entscheidungsstrategien sind aus strukturalistischer Sicht notwendig, 
um die erfolgreichen Anwendungsbereiche von Theorie-Elementen zu identifizieren. 
Aber auch Vertreter der Falsifikationsmethodologie betonen, dass Entscheidungs- 
kriterien immer dann (auf irgendeine Weise) festgelegt werden miissen, wenn 
Hypothesen nicht streng deterministisch formuliert oder die Daten nicht ganz 
fehlerfrei sind. 743 

Der Signifikanztest ist keineswegs die einzige Methode zur Festlegung von 
Entscheidungs- und Bewertungskriterien. 744 Gegeniiber anderen moglichen Vor- 
gehensweisen vereinigt er aber mehrere Vorteile in sich. 

Erstens wird systematisch beriicksichtigt, dass Beobachtungsdaten stets durch 
unvermeidliche Abweichungen von den Ceteris-paribus-Bedingungen und viele 



J Popper (1984, S. 145-146), Lakatos (1974b, S. 107) 

744 Eine Alternative ist die gezielte und ausfiihrliche explorative Datenanalyse (Jambu, 
1992; Sedlmeier, 1996; Smith & Prentice, 1993; Tukey, 1977). Sie sollte den 
Signifikanztest jedoch eher erganzen als ersetzen. So kann es bei nicht-signifikanten 
Mittelwertsunterschieden sinnvoll sein zu priifen, ob die Gruppen sich in anderer Weise 
unterscheiden (Wilcox, 1995). Als Alternative zum Signifikanztest wird auch die Bayes- 
Statistik vorgeschlagen (Molenaar & Lewis, 1996; Oakes, 1986; Wendt, 1983; Winkler, 
1993; Witte, 1980). Dabei miissen aber (subjektive) A-priori- Wahrscheinlichkeiten flir 
die Richtigkeit der statistischen Hypothesen geschatzt werden. 
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Zufallsfaktoren beeinflusst werden. Durch Signifikanztests wird gepriift, ob iiber 
diese “Fehlervarianz” hinaus noch systematische Unterschiede bestehen. 

Zweitens konnen die Kriterien flir diese Entscheidung konsistent und ohne 
unrealistische Annahmen begriindet werden, wenn man das Permutationsprinzip her- 
anzieht. 

Drittens kann durch explizite Kontrolle sowohl der a- wie der (3-Fehlerwahr- 
scheinlichkeiten in systematischer Weise sowohl die Strenge wie das Wohlwollen 
der Priifung beeinflusst werden. Dabei ist es hilfreich, dass die wichtigsten para- 
metrischen Testverfahren als Approximationen von Permutationstests interpretiert 
werden konnen. 

Viertens ist der Signifikanztest unter den Fachwissenschaftlern eine weithin 
akzeptierte Strategic zur Datenauswertung und Hypothesenpriifung. Derartige Kon- 
ventionen sind ein notwendiger Bestandteil des fachwissenschaftlichen Paradigmas, 
ohne die eine normalwissenschaftliche Forschung nicht moglich ist. 

Der Ausgang einer Entscheidung iiber eine empirische Hypothese hangt natiirlich 
nicht nur von den gegebenen Daten ab, sondern auch von den Kriterien, die dabei 
zugrunde gelegt werden. Die in der Forschungspraxis immer noch weit verbreitete 
herkommliche Form des Signifikanztests beriicksichtigt bei der Entscheidung zwar, 
ob die empirischen Ergebnisse unter der Annahme der Nullhypothese eher unwahr- 
scheinlich sind oder nicht, ignoriert aber sowohl die GroBe des empirischen Effektes 
als auch die Teststarke 1 — (3 (siehe oben Kapitel 15.1). Verbesserte Kriterien zur 
Entscheidung liber statistische und empirische Hypothesen werden unten im Kapitel 
17 beschrieben. 

Der Ausgang einer signifikanzstatistischen Entscheidung hangt auch davon ab, 
welcher Test durchgeflihrt wird und welche Festlegungen dabei implizit oder explizit 
getroffen werden: Wird ein parametrischer t-Test durchgeflihrt, ein Rangtest oder ein 
Chi-Quadrat-Haufigkeitsvergleich? Wird das Signifikanzniveau auf 5% oder auf 1% 
gesetzt? Wird die Zahl der Untersuchungseinheiten willkiirlich gewahlt oder rational 
geplant? Wird bei einer Testplanung l-(3 gleich 0,95 oder nur gleich 0,80 gesetzt? 
Sollen mit dieser Teststarke mittlere oder nur groBe Effekte entdeckt werden? Nimmt 
man die Varianzen als gleich an oder nicht? Werden A-priori- oder Post-hoc- 
Kontraste durchgeflihrt? Wird die Kumulation der a-Fehler ausgeglichen? 

Zu jeder dieser Fragen gibt es in angewandter Statistik und psychologischer 

• • 

Methodenlehre eine mehr oder minder groBe Anzahl von Uberlegungen, die in der 
Regel am Populationsmodell des Signifikanztests ausgerichtet sind und oft in 
unterschiedlichen Ergebnissen und Empfehlungen resultieren. 

Betrachten wir den Signifikanztest als Teil einer Strategic, um zu Entscheidungen 
iiber empirische Flypothesen zu gelangen, miissen alle Bestimmungsstiicke und 
Kriterien so gewahlt werden, dass die Validitat der Untersuchung maximiert wird, 
d.h. dass die Wahrscheinlichkeiten fur falsche Entscheidungen iiber die empirische 
Hypothese minimiert werden. 
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Die notwendige Anzahl von Untersuchungseinheiten sollte stets systematisch so 
bestimmt werden, dass die interessierende Effekte mit hoher Wahrscheinlichkeit als 
signifikant entdeckt werden (siehe unten Kapitel 15.5). Die Untersuchungen haben 
dann in aller Regel eine hohere Validitat als wenn man mit den gerade verfiigbaren 
GruppengroBen arbeitet. 

In anderen Fallen ist nicht eindeutig zu bestimmen, ob eine bestimmte 
Veranderung bei der Durchfuhrung eines Signifikanztests die Validitat insgesamt 
erhoht oder nicht, man kann aber bestimmen, auf welche der beiden Komponenten 
der Validitat, die Strenge und das Wohlwollen, sie positiv bzw. negativ wirken. 

0 Folgt aus der empirischen Hypothese die Erwartung, dass die Werte in der einen Gruppe 
groGer sind als in der anderen, wird durch eine Verringerung des Signifikanzniveaus a 
von 0,05 auf 0,01 (bei Gleichheit aller anderen Bedingungen) die Strenge der Priifung 
hoher und das Wohlwollen geringer. 

Eine begriindete Entscheidung iiber derartige Testmerkmale ist dann moglich, wenn 
man vorher die Validitatskomponenten fur die vorliegende Untersuchung gewichtet 
hat: Will man die empirische Hypothese eher auf eine strenge Priifung stellen oder 
will man ihr eher wohlwollend eine gute Bewahrungschance lassen? 

0 Mitunter ergibt sich fiir eine vorhergesagte Mittelwertsdifferenz ein p-Wert zwischen 
0,01 und 0,05, das heiBt sie ware auf dem 5%-Niveau signifikant, nicht aber auf dem \%- 
Niveau. Bei einer strengen Priifung der empirischen Hypothese wiirde man sie als nicht 
(ausreichend) bestatigt ansehen. Bei einer wohlwollenden Priifung dagegen konnte man 
sie auch als (eingeschrankt) bestatigt bezeichnen. 

15.3.7 Unabhangigkeit der Beobachtungen 

Sowohl bei Populationstests wie bei Permutationstests erfolgen die Ableitungen der 
Testverteilungen unter einer Voraussetzung, die unbedingt notwendig ist, aber 
dennoch oft iibersehen wird: Die einzelnen Werte der abhangigen Variablen miissen 
voneinander unabhangig sein. Verletzungen dieser Annahmen konnen zu erheblichen 
Differenzen zwischen tatsachlichen und nominellen p-Werten fiihren. 745 

0 Werden nach einem Forced-Compliance-Experiment die Meinungen der Untersuchungs- 
personen gleichzeitig in einer Schulklasse erhoben, ist zu erwarten, dass sie sich in ihren 
Antworten gegenseitig beeinflussen. 

Da bei (approximativen) Permutationstests die parametrischen Annahmen iiber 
Normal verteilung und Varianzhomogenitat entfallen, ist die Unabhangigkeit die 
einzige wesentliche Voraussetzung fiir ihre valide Anwendung. Bestehen 
Abhangigkeiten zwischen den Werten der abhangigen Variablen, ist die Annahme 
verletzt, unter der die Ableitung der Testverteilung erfolgt: dass alle Gruppen- 
aufteilungen gleich wahrscheinlich sind. 



745 



Kenny & Judd (1986), Stevens (1990, S. 43-47) 





Signifikanztestvaliditat 



353 



Sicherung der Unabhangigkeit 

Da sich bei Abhangigkeiten zwischen einzelnen Werten der AV die Validitat der 
Untersuchung vermindern kann, muss durch geeignete MaBnahmen bei der Durch- 
flihrung der Untersuchung verhindert werden, dass die Merkmalstrager sich in 
irgendeiner Form gegenseitig beeinflussen. Sollen Eigenschaften, Verhaltensweisen, 
Leistungen oder Urteile einzelner Personen als AV erhoben werden, sollten deshalb 
mehrere Personen nur dann gemeinsam untersucht werden, wenn aufgrund der 
Aufgabencharakteristika und der raumlichen Bedingungen eine gegenseitige 
Beeinflussung ausgeschlossen werden kann. 

Besonders groB ist die Gefahr von Abhangigkeiten zwischen verschiedenen 
Realisationen der AV, wenn diese von der gleichen Person stammen. Derartige 
Dopplungen konnen mitunter unbeabsichtigt und unbemerkt eintreten. 

0 Wenn wir die Studienzufriedenheit erheben, indem wir jeweils alle Teilnehmer mehrerer 
Lehrveranstaltungen befragen, kann es sein, dass Studierende in mehreren dieser 
Veranstaltungen sitzen. Um keine abhangigen Daten zu bekommen, miissen wir daftir 
sorgen, dass von jeder Person nur ein Fragebogen in die Auswertung eingeht. 

Es gibt allerdings durchaus auch Situationen, in denen man mit gewisser 
Berechtigung annehmen kann, dass wiederholte Daten von der gleichen Person 
unabhangig sind. Dazu gehoren vor allem psychophysische Experimente, bei denen 
die Person nach einer ausfiihrlichen Trainingsphase verschiedene Tone, Gewichte 
usw. wiederholt beurteilen muss, ohne dass sie diese wiedererkennen kann. 746 



15.4 Berucksichtigung von EffektgroBen 

Tritt in einem herkommlichen Signifikanztest ein signifikantes Ergebnis auf, wird 
die Nullhypothese abgelehnt und die Alternativhypothese wird angenommen. Auf 
der Ebene der statistischen Hypothesen hat sich damit eine eindeutige Entscheidung 
ergeben. Auf der Ebene der uns primar interessierenden empirischen und wissen- 
schaftlichen Hypothesen kann trotzdem die Wahrscheinlichkeit fur Fehlentschei- 
dungen erhoht sein, wenn die GroBe des empirischen Effektes nicht beriicksichtigt 
wird. Die Beziehungen werden zusammenfassend im Kapitel 15.4.4 dargestellt. 
Zuvor wird beschrieben, wie EffektgroBen ausgedruckt und bewertet werden konnen 
(Kapitel 15.4.1 bis 15.4.3). 

15.4.1 Kategorien von EffektgroBen 

Allgemein gesagt ist ein empirischer Effekt die GroBe der Abweichung der 
empirischen Daten von der Situation, die bei Gliltigkeit der (exakten) Nullhypothese 
zu erwarten ist. Statistisch gesehen sind EffektgroBen ein MaB fur den 



746 



Hays (1994, S. 407-408); siehe oben Kapitel 14.3.3 
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Zusammenhang zwischen zwei Variablen: Sind die Variablen unabhangig 

voneinander, ist die EffektgroBe gleich Null. EffektgroBen ungleich Null zeigen also 
eine statistische Assoziation an. 

In der einschlagigen Literatur finden sich zahlreiche verschiedene EffektgroBen. 
Zum einen legen verschiedene statistische Tests unterschiedliche Moglichkeiten 
nahe, die GroBe von empirischen Effekten auszudriicken. Zum anderen gibt es bei 
jedem Test mehrere sinnvolle Moglichkeiten, EffektgroBen zu definieren. 747 Erstens 
kann man absolute und relative EffektgroBen unterscheiden. Zweitens konnen 
EffektgroBen auf Mittelwertsdifferenzen oder auf Varianzanteilen beruhen. Drittens 
gibt es neben einfach definierten MaBen fiir die empirischen Effekte meist noch 
etwas kompliziertere Ausdriicke, die erwartungstreue Schatzungen fiir die 
Populationseffekte darstellen. 

Absolute und relative Effektgrojlen 

Beim Vergleich zweier Gruppen durch einen t-Test ist unter der exakten 
Nullhypothese die Gleichheit der Mittelwerte zu erwarten. Die tatsachliche Differenz 
der empirischen Mittelwerte ist ein absolutes MaB fiir die GroBe des empirischen 
Effektes. Sie sind vor allem dann sinnvoll, wenn Prozentsatze oder bekannte 
MaBeinheiten als abhangige Variable betrachtet werden. 

0 Bei der Behandlung von chronisch schizophrenen Langzeitpatienten auf einer Station, die 
auf soziales Lernen ausgerichtet war, erreichten 10% der Patienten das Ziel, ein 
unabhangiges Leben zu fiihren, auf einer traditionell gefiihrten Station jedoch keiner. 

0 Im Experiment von Santa zur Dualen Kodierungstheorie von Paivio unterscheiden sich 
die Reaktionszeiten beim Wiedererkennen zwischen bildlichen und verbalen Bedingun- 
gen um etwa 100 msec. 749 

Schwierigkeiten bei der Interpretation von absoluten EffektgroBen treten auf, wenn 
keine Informationen fiber die Varianz der betrachteten abhangigen Variablen 
vorliegen. Beispielsweise ist eine Reaktionszeitdifferenz von 100 msec bei einer 
Standardabweichung von s = 500 relativ gesehen viel kleiner als bei s = 10. 

Deshalb hat es Vorteile, EffektgroBen nicht in absoluter, sondern in relativer 
Form auszudriicken. Fiir den Vergleich zweier Mittelwerte wird ihre Differenz auf 
die gemeinsame Standardabweichung der Werte innerhalb der Gruppen relativiert. 
Die resultierende empirische EffektgroBe bezeichnet man als d: 750 



747 

748 

749 

750 



Bredenkamp (1970), Hager (1983a; 1987, S. 214-215; 1996b), O’Grady (1982), Fowler 
(1987), Tatsuoka (1993), Richardson (1996) 

Zimbardo & Gerrig (1999, S. 649-650) 

Anderson (1996a, S. 105) 

Diese EffektgroBe wird bei Cohen (1988, S. 66) als d s und bei Hedges & Olkin (1985, S. 
78) als g bezeichnet. Im Nenner von d wird die gemeinsame Standardabweichung s 
aus (15-11) verwendet. Ihr Quadrat entspricht der varianzanalytischen Fehlervarianz 
(Mittlere Quadratsumme innerhalb der Gruppen, siehe unten Seite 381, FuBnote 811), 
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(15-19) d = — — — . 

s p 

0 Flir die Daten in Tabelle 15.1 sind die Mittelwerte 34,5 und 53,0, die gemeinsame 
Standardabweichung nach (15-14) betragt s p = 10,7 , 751 Die EffektgroBe ist d = 1,73. 

0 In der fiktiven Untersuchung der Studienzufriedenheit (siehe Seite 327) hat sich y x = 
12,0, y 2 = 10,0, Si = 3,0 und S 2 = 4,0 ergeben. Die Schatzung fiir die gemeinsame 
Varianz war s p = 12,38 , die Wurzel ist s p = 3,52 . Die EffektgroBe ist dann d = 0,57. 

Fur jeden Stichprobeneffekt d kann ein Konfidenzintervall aufgestellt werden. Seine 
Breite hangt von der GroBe des tatsachlichen Effektes ab, vor allem aber von der 
Zahl der Untersuchungseinheiten. Das Quadrat des Standardfehlers von d wird wie 
folgt geschatzt: 752 



(15-20) 




n ! + n 2 [ d 2 

n,n 2 2(n, + n 2 ) 



0 Fiir die Beispieldaten mit d = 0,57; n t = 32 und n 2 = 30 ist sjj = 0,07 , der Standardfehler 
betragt damit s t [ = 0,26. 

Das Konfidenzintervall fiir den tatsachlichen Effekt 8 kann dann iiber die Normal- 
verteilung approximiert werden. Fur a = 0,05 ergibt sich: 

(15-21) P(d-1,96 s d < 8< d + 1,96 s d ) = 0,95 . 

0 Die untere Grenze des 95%-Konfidenzintervalls ist 0,57-1,96 0,26 = 0,06, die obere 
Grenze entsprechend 0,57 + 0,51 = 1,08. Es umfasst nicht den Wert Null, auch nach 
dieser Priifmethode ist der Mittelwertsunterschied also signifikant. 



Korrelationen und Varianzverhaltnisse 

Zur besseren Vergleichbarkeit der Effekte ist es sinnvoll, in verschiedenen 
Untersuchungen und fiir verschiedene Tests einen einheitlichen Index fiir die GroBe 
eines Effektes zu verwenden. Dafiir am besten geeignet sind (einfache bzw. multiple) 
Korrelationen (r bzw. R). Quadriert man eine Korrelation, erhalt man einen 
Varianzanteil , das heiBt den Anteil an der Varianz der einen Variablen, der durch die 
andere Variable (bzw. die anderen Variablen) aufgeklart wird. 



die auch bei mehr als zwei Gruppen berechnet werden kann (Hager, 1996b, S. 92). Bei 
einer anderen Definition von d (Rosenthal, 1991, S. 14-16) beruht die gemeinsame 
Varianz nicht auf Division durch n : + n 2 - 2 , sondern durch n : + n 2 . Inhaltlich kann es 
in bestimmten Fallen sinnvoll sein, im Nenner von d nur die Standardabweichung der 
Werte in der Kontrollgruppe zu verwenden (Glass, McGaw & Smith, 1981). Zur 
erwartungstreuen Schatzung des Populationseffekts 8 wird d etwas nach unten korrigiert 
(Fricke & Treinies, 1985, S. 76; Hedges & Olkin, 1985, S. 78-80). Diese Korrektur fallt 
umso geringer aus, je groBer die Stichprobe ist. 

751 In SPSS wird beim t-Test leider weder d noch s p mit ausgegeben. 

752 Fricke & Treinies (1985, S. 77), Hedges & Olkin (1985, S. 86) 

753 Rosenthal (1991, S. 17-18) 
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Korrelationen und Varianzanteile driicken das AusmaB des Zusammenhangs 
zwischen den beteiligten Variablen aus. Sie spiegeln damit die Information wider, 
die in Variablen fiber andere Variablen enthalten ist: 754 Miissen wir die Auspragung 
einer Variablen Y bei zufallig ausgewahlten Untersuchungseinheiten vorhersagen, 
ohne dass wir irgendeine Information liber sie haben, ist die Varianz s Y ein 
Ausdruck fur die Unsicherheit oder Fehlerhaftigkeit dieser Vorhersage. Kennen wir 
jedoch jeweils die Auspragung einer mit Y assoziierten Variablen X, reduzieren sich 
diese Fehler und Unsicherheiten. Die bedingte Varianz s z Y , x , das ist die Varianz von 
Y fur feste Auspragungen von X, ist ein Ausdruck fur diese reduzierte Unsicherheit. 
Die relative Reduktion an Unsicherheit wird durch einen Varianzanteil wie r 2 
ausgedriickt: 755 



(15-22) 




Der mit 100 multiplizierte Varianzanteil ist also ein prozentuales MaB fur die relative 
Reduktion an Unsicherheit oder Fehlerhaftigkeit. 

0 Die Korrelation zwischen den Noten in der Haupt- oder Realschule und beim Abschluss 
der Berufsausbildung betragt r = 0,41. 756 Die gemeinsame Varianz ist r 2 =0,168. Die 
Unsicherheit liber die spateren Ausbildungsergebnisse von Jugendlichen wird also durch 
Kenntnis der Schulnoten um knapp 17% reduziert. 

Etliche EffektgroBen lassen sich (zumindest unter bestimmten Annahmen) numerisch 
direkt in Korrelationen umrechnen. AuBerdem konnen alle moglichen EffektgroBen 
indirekt in Korrelationen iiberftihrt werden, indem man sie jeweils auf die Standard- 
normalverteilung bezieht. Beide Wege werden im Folgenden erlautert. 



15.4.2 EffektgroBen bei verschiedenen statistischen Tests 

Die EffektgroBe beim t-Test wird meist als standardisierte Mittelwertsdifferenz d 
ausgedriickt. Sind in einer empirischen Arbeit keine EffektgroBen angegeben (was 
leider noch sehr haufig vorkommt), konnen sie einfach aus den t-Werten errechnet 
werden. Dazu betrachten wir zunachst die Teststatistik t emp , die nach Definition (15- 
13) in einer einfachen Beziehung zur zugehorigen EffektgroBe d steht: 

(15-23) w =2^ = _S^2 l 

s v -v n, + n 

2 1 s n M 

V n l n 2 

Die Umkehrung von (15-23) ergibt die Formel zur Berechnung von d- aus t-Werten: 



= d 



n l n 2 

n i + n 2 



nach Hays (1994, S. 331-333) 

755 J 

Bortz (1999, S. 198), entsprechendes gilt fur R 2 und andere Varianzanteile 

756 Zimbardo & Gerrig (1999, S. 756) 
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(15-24) d = t 

V n l n 2 

0 Fur die Beispieldaten zur Studienzufriedenheit mit n = 32 und n 2 = 30 haben wir ein t = 
2,24 berechnet. Es entspricht nach (15-24) d = 0,57, was mit dem iiber (15-19) direkt 
berechneten d-Wert ubereinstimmt. 



Jede empirische t-Teststatistik (und damit jede EffektgroBe d) kann leicht in einen 
Produkt-Moment-Korrelationskoeffizienten (und damit in einen anderen Ausdruck 
fur die GroBe des empirischen Effektes) umgerechnet werden: 757 



(15-25) 



r = 



t 



2 

emp 



t 



emp 



+ (n^ + n 2 — 2) 



0 Fur das Beispiel zur Studienzufriedenheit mit d = 0,57 und t = 2,24 ergibt sich r = 0,28. 

0 Fur die Daten in Tabelle 15.1 mit n : = 4, n 2 = 6, d = 1,73 und t = 2,68 ist r = 0,69. 

Diese aus d- oder t-Werten berechneten Korrelationen entsprechen genau der 
ublichen Produkt-Moment-Korrelation zwischen den Werten der Personen auf der 
abhangigen Variablen Y und ihren Werten auf einer Kodiervariablen G flir die 
Gruppenzugehorigkeit. 758 Die Prlifung eines Mittelwertsunterschieds zwischen zwei 
Gruppen durch einen t-Test mit der exakten H 0 : =0 und die Prlifung der 

entsprechenden Produkt-Moment-Korrelation durch den t-Test mit der exakten H 0 : 
p GY =0 sind dementsprechend Equivalent und fiihren zu numerisch identischen 
Ergebnissen. 759 

0 Um dies deutlich zu machen, sind die Daten des fiktiven Zweigruppenvergleichs aus 
Tabelle 15.1 in der Tabelle 15.4 in anderer Weise angeordnet. Die Werte der abhangigen 
Variablen flir alle 10 Personen sind in der Spalte Y aufgefuhrt. Die Gruppenzugehorigkeit 
der Personen ist durch die Gruppierungsvariable G ausgedrlickt. Sie ist so definiert, dass 
Personen aus der Kontrollgruppe den Wert von 0 und Personen aus der 
Behandlungsgruppe den Wert 1 haben. Berechnet man die Produkt-Moment-Korrelation 

V60 

zwischen Y und G, ergibt sich wiederam r = 0,69. 



J Fricke & Treinies (1985, S. 110), Rosenthal (1991, S. 25) 

758 

Diese Korrelation wird haufig als punkt-biseriale Korrelation bezeichnet (Bortz, 1999, 
S. 215; Fricke & Treinies, 1985, S. 110). Dies ist nur ein (rechnerisch einfacherer) 
Spezialfall der Produkt-Moment-Korrelation flir den Fall einer kontinuierlichen und 

einer zweiwertigen (dichotomen) Variablen. 

759 

Ein varianzanalytischer F-Test auf Gleichheit der Mittelwerte in J Gruppen ist 
dementsprechend Equivalent mit einem F-Test der multiplen Korrelation zwischen der 
abhEngigen Variablen und J-l Gruppierungsvariablen (Bortz, 1999, S. 475-480; Hays, 
1994, S. 745-758). Wegen dieser Aquivalenzen ist es irrefuhrend, wenn in 
Statistikbtichern zwischen Tests zur Prlifung von Unterschiedshypothesen und Tests zur 
Uberprufung von Zusammenhangshypothesen unterschieden wird. 

760 In SPSS und anderen Statistikprogrammen muss die Gruppenzugehorigkeit der Personen 
in jedem Fall durch derartige Kodiervariablen angegeben werden. Fur den Vergleich 
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Tabelle 15.4: Fiktive empirische Ergebnisse in Korrelationsdarstellung 



Y 


G 


17 


0 


36 


1 


39 


0 


40 


0 


42 


0 


48 


1 


54 


1 


55 


1 


61 


1 


64 


1 



Effektgrojien bei der Varianzanalyse 



Hypothesen iiber die Gleichheit oder Ungleichheit von mehr als zwei Mittelwerten 
konnen durch den varianzanalytischen F-Test gepriift werden. Fur einen Faktor A 

HZ' 1 

mit J Auspragungen kann die Teststatistik folgendermaBen geschrieben werden: 



(15-26) 



QS a /( j - 1) _ mqs a 

QS 

Fehler / J(n 1) MQS Fehler 



QS a und QSp e hi er sind dabei die Quadratsummen zwischen bzw. innerhalb der 
Auspragungen des Faktors A, MQS A und MQSp e hi e r sind die mittleren Quadrat- 
summen, die Schatzungen der entsprechenden Varianzen darstellen. 762 

Die GroBe eines empirischen Effekts bei einer Varianzanalyse kann durch ein 
Verhaltnis von Quadratsummen ausgedrlickt werden, das als T| 2 bezeichnet wird und 
Equivalent zu einer quadrierten (multiplen) Korrelation R 2 ist. Fiir den Effekt des 
Faktors A auf die abhangige Variable beispielsweise ist dieser Koeffizient folgender- 

^7 /TO 

maBen definiert: 



zweier Gruppen mit dem t-Test kann die EffektgroBe r deshalb einfach durch 
Korrelation der AV mit der Kodiervariablen errechnet werden. 

761 Bortz (1999, S. 237-247), Hays (1994, Kap. 10.10-10.12) 

QSa (oder QS zw i SC h en ) ist die Summe der quadrierten Abweichungen der Mittelwerte der 
Auspragungen des Faktors A vom Gesamtmittelwert. QS Fe hi er (oder QSj nner h a ib) ist die 
Summe der quadrierten Abweichungen der einzelnen Y-Werte von ihrem jeweiligen 
Gruppenmittelwert. QS tota i ist die Summe der quadratischen Abweichungen der Werte 
vom Gesamtmittelwert. Bei der einfaktoriellen Varianzanalyse ist QS tota i = 
QSA+QSpehler- 

763 Bortz (1999, S. 244-245), Hays (1994, S. 332, 401-403), Hager (1987, S. 144-145). Da 
diese EffektgroBe kein Populationsparameter ist, sollte sie eigentlich nicht mit einem 

r\ 

griechischen Buchstaben bezeichnet werden, doch hat die Bezeichnung T| sich 
weitgehend eingebtirgert. Bei einer einfaktoriellen Varianzanalyse ist r\ z A Equivalent zur 
quadrierten multiplen Korrelation R 2 zwischen Y und J-l Kodiervariablen. Die 
entsprechenden Varianzanteile in der Population, co 2 bzw. p 2 , werden etwas 
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(15-27) 






QS 



A 



QS A + QSpehler 



Dieser Varianzanteil ist per definitionem auf den Wertebereich zwischen 0 und 1 
beschrankt. Haben wir nur eine unabhangige Variable, ist der Nenner gleich der 
totalen Quadratsumme, und der Quotient gibt den Anteil der Varianz der AV Y an, 
der durch eine unabhangige Variable A erklart wird. Bei einem mehrfaktoriellen 
Versuchsplan gibt T|j v den Anteil von A an der Varianz von Y an, nachdem der 
Einfluss der anderen Variablen und der Interaktionen auspartialisiert worden ist. 764 

Fiir Effekte in der Varianzanalyse wird haufiger auch der Koeffizient f 2 
verwendet: 765 



(15-28) 



f 2 _ QS A 

Q^Fehler 



Die Varianz zwischen den Gruppen wird hier nicht zur Gesamtvarianz, sondern zur 
Varianz innerhalb der Gruppen in Beziehung gesetzt wird. Der Koeffizient f 2 ist also 
kein Varianzanteil und nicht auf den Bereich zwischen 0 und 1 beschrankt. Er lasst 
sich eindeutig in r| 2 umrechnen (und umgekehrt). 

In den Ausdrucken der Statistikprogramme und den Ergebnisteilen von wissen- 

n/'/' 

schaftlichen Arbeiten werden leider haufig die EffektgroBen nicht mit ausgegeben. 
Da in den typischen Ergebnistabellen fiir Varianzanalyse jedoch immer die 
Quadratsummen aufgeflihrt sind, lassen sich die EffektgroBen auch nachtraglich 
einfach berechnen. 

9 Die fiktiven Daten aus des Zweigruppenvergleichs aus Tabelle 15.1 und Tabelle 15.4 
wurden in SPSS ausgewertet. Die Tabelle 15.5 ist die von SPSS ausgegebene voll- 
standige Ergebnistabelle. Die in ihr enthaltenen GroBen entsprechen den ublichen Werten 
fiir den t-Test, die wir im Vorangegangenen berechnet haben. Zieht man aus dem in der 
Zeile G angegebene F = 7,166 die Wurzel, erhalt man das oben berechnete t = 2,68, denn 
eine F- Variable mit einem (Zahler-)Freiheitsgrad ist stets gleich einer quadrierten t- 
verteilten Variable. Da die Varianzanalyse die Mittelwertsgleichheit ungerichtet prlift, ist 
das fiir den Faktor G angegebene p = 0,028 (Spalte “Signifikanz”) genau das Doppelte 
des fiir die t-Verteilung ermittelten einseitigen p = 0,014. Die Wurzel aus dem 



764 



765 

766 



767 



iiberschatzt (Hays, 1994, S. 408-409, 498-500; Keppel, 1991, S. 64-66; Richardson, 
1996, S. 18-19). 

Der in (15-27) definierte Quotient ist ein partielles T| 2 . Beim ublichen, semi-partiellen T| 2 
steht im Nenner die gesamte Quadratsumme (Bortz, 1999, S. 289; Bredenkamp, 1980, S. 
70-71; Hager, 1987, S. 144-145, 227-228). 

Cohen (1988 S. 276) 

In SPSS wird T| 2 auf Wunsch mit ausgegeben: im Menu Mittelwerte durch die Option 
“ANOVA-Tabelle und eta”, im Allgemeinen linear en Modell durch “Schatzer der 
EffektgroBe”. 

Menu: “Allgemeines lineares Modell: allgemein mehrfaktoriell” mit Option “Schatzer 
der EffektgroBe”; Syntax: UNIANOVA mit /PRINT=ETASQ 
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T) 2 =0,473 schlieBlich ergibt die berechnete Korrelation r = 0,69, denn es ist T| 2 = r 2 . 
Der Varianzanteil T| 2 ergibt sich definitionsgemaB, wenn wir die in der Tabelle 
angegebene Quadratsumme zulasten des Faktors G (QSg = 821,4) durch die (korrigierte) 
Gesamtquadratsumme (QS tota i = 1738,4) teilen. 768 Er ist auch noch einmal unterhalb der 
Tabelle als R-Quadrat fiir das gesamte korrigierte Modell angegeben. 769 

Tabelle 15.5 : Ergebnistabelle fiir die Daten aus Tabelle 15.1 und Tabelle 15.4 



Tests der Zwischensubjekteffekte 



Abhangige Variable: Y 


Quelle 


Quadratsumme 


df 


Mittel der 


F 


Signifikanz 


Eta- 




vom Typ III 




Quadrate 






Quadrat 


Korrigiertes Modell 


821,4 a 


1 


821,4 


7,17 


,028 


,473 


Konstanter Term 


18375,0 


1 


18375,0 


160,31 


,000 


,952 


G 


821,4 


1 


821,4 


7,17 


,028 


,473 


Fehler 


917,0 


8 


114,6 








Gesamt 


22532,0 


10 










Korrigierte Gesamtvariation 


1738,4 


9 











a R-Quadrat = ,473 (korrigiertes R-Quadrat = ,407) 



Effektgrofien bei Korrelationen 

In nicht-experimentellen Untersuchungen werden sehr haufig die Produkt-Moment- 
Korrelationen zwischen Variablen betrachtet, die kontinuierlich sind, das heiBt die 
jeweils sehr viele, im Prinzip sogar unendlich viele Auspragungen annehmen 
konnen. Aus der psychologischen Hypothese folgt dabei meist eine gerichtete 
Vorhersage dariiber, dass beide Variablen in bestimmter Richtung zusammenhangen. 

0 Aus psychologischen Konzeptionen zur Arbeitszufriedenheit folgt, dass die Arbeits- 
zufriedenheit positiv mit dem Jahresverdienst und negativ mit den Fehlzeiten korreliert. 

Ob eine empirische Korrelationen systematisch von Null abweicht, kann mit Hilfe 

770 

eines t-Tests gepriift werden: 

(15-29) t= 7 1 Vn-2 

Vl-r 2 

Moglich sind dabei je nach empirischer Vorhersage einseitige Tests (z.B. der H 0 : p < 
0 gegen die Hp p > 0) oder zweiseitige Tests (H 0 : p = 0 gegen Hp p =£ 0). Als 



768 

Diese Quadratsumme wird als korrigierte bezeichnet, weil die hier inhaltlich nicht 
interessierende Abweichung des Gesamtmittelwerts von Null (Zeile “konstanter Term”) 
unberlicksichtigt bleibt. 

769 Das korrigierte R 2 = 0,407 ist eine erwartungstreue Schatzung des tatsachlichen 
Varianzanteils. 

770 Bortz (1999, S. 207), Hays (1994, Kap. 14.21) 
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empirische EffektgroBe kann direkt die GroBe der empirischen Korrelation r 
verwendet werden. Man kann aber auch die quadrierte Korrelation r 2 verwenden, da 
dieser Determinationskoeffizient den Anteil der Varianz ausdriickt, den beide 
Variablen gemeinsam haben. 



Effektgrofien bei multiplen Regressionen 



Psychologische Hypothesen iiber den Zusammenhang zwischen einer abhangigen 
Variablen und mehreren unabhangigen Variablen konnen mit Hilfe der multiplen 
Regression geprlift werden. Die abhangige Variable wird dabei meist als Kriterium 
bezeichnet, die unabhangigen Variablen als Pradiktoren. Bei der multiplen 
Regression wird berechnet, wie die unabhangigen Variablen in einer linearen 
Funktion kombiniert werden mtissen, damit die abhangige Variable moglichst genau 

77 1 

vorausgesagt werden kann. 

0 Nach der Theorie der Person-Umwelt-Passung hangt die Zufriedenheit von Studierenden 
davon ab, inwieweit aus ihrer Sicht ihre Fahigkeiten den Studienanforderungen 

772 

entsprechen und inwieweit sie ihre Bedlirfnisse durch das Studium erflillen konnen. 
Bestimmt man durch geeignete Fragebogen quantitative Werte fiir die Zufriedenheit Y, 
die subjektive Uberforderung Xj und die subjektive Bedurfniserftillung X 2 , ist ein 
Zusammenhang zwischen Xi und X 2 einerseits und Y andererseits zu erwarten. 



Ob der Zusammenhang zwischen Pradiktoren und Kriterium systematisch von Null 
abweicht, kann durch einen F-Test geprlift werden. Die Teststatistik kann 

777 

folgendermaBen geschrieben werden: 



(15-30) 



F = 



R 2 N-J-l 



1 - R 



Dabei ist N die Zahl der Personen, und J ist die Zahl der Pradiktoren. R ist die 
multiple Korrelation zwischen den Pradiktoren und dem Kriterium. Sie ist ein MaB 
fiir die GroBe des linearen Zusammenhangs zwischen Pradiktoren und Kriterium und 
damit ein Index fiir die GroBe des Effektes. 



Effektgrofien bei Chi-Quadrat-Tests 

Psychologische Zusammenhangshypothesen werden empirisch oft an Variablen 
untersucht, die nicht quantitativ sind, sondern mehrere qualitativ verschiedene 
Auspragungen annehmen konnen. Sie werden als nominale Variablen bezeichnet. 



Bortz (1999, S. 433-456), Hays (1994, Kap. 15), besonders gute Darstellungen: Cohen 
& Cohen (1983), Pedhazur (1982), Tabachnick & Fidell (1989) 

772 

Person-environment fit theory (Caplan, 1987; Harrison, 1978; Spies, Westermann, Heise 
& Hagen, 1998; Spies, Westermann, Heise & Schiffler, 1996) 

Bortz (1999, S. 435-436) 



773 
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0 In einer Untersuchung zur Arbeitszufriedenheit werden die Personen unter anderem 
gefragt, ob ihre berufliche Tatigkeit hauptsachlich handwerklich, kaufmannisch oder 
sozial-kommunikativ gepragt ist. AuBerdem werden sie gefragt, ob ihre Freizeit- 
beschaftigungen eher individuell oder eher gruppenorientiert sind. Erwartet wird eine 
positive Assoziation zwischen diesen beiden nominalen Variablen. 

Hypothesen liber die Abhangigkeit bzw. Unabhangigkeit von zwei nominalen 
Variablen konnen durch Chi-Quadrat-Tests gepriift werden. Ausgangspunkt sind 
jeweils die Haufigkeitsdaten aus einer sog. Kontingenztafel. Sie enthalt die 
beobachteten Haufigkeiten (fb), mit der die verschiedenen Auspragungen der beiden 
Variablen und die verschiedenen Auspragungskombinationen aufgetreten sind. Zur 
Verdeutlichung der iiblichen Bezeichnungen fur diese Haufigkeiten ist in Tabelle 
15.6 eine 2-mal-3 -Kontingenztafel dargestellt. 

Tabelle 15.6: Kontingenztafel: Bezeichnungen fur beobachtete Haufigkeiten 





A, 


^2 


A 3 




Bi 


fbn 


fb i2 


fbi 3 


ft*!. 


b 2 


fb 2 i 


fb 22 


fb 23 


fb 2 . 




fb.! 


fb . 2 


fb . 3 


N 



Durch den Chi-Quadrat-Test werden die beobachteten Haufigkeiten Tby in den 
einzelnen Auspragungskombinationen mit den Haufigkeiten fey verglichen, die unter 
der Annahme der Unabhangigkeit der beiden Variablen A und B zu erwarten sind. 
Diese Haufigkeiten ergeben sich aus der Multiplikation der entsprechenden 
Randhaufigkeiten : 



(15-31) 



fbj.fb.j 
ie = - 

1J N 



Die Teststatistik des Chi-Quadrat-Tests ist folgendermaBen definiert: 



774 



k r 



(15-32) 



x 2 =II 

j=l i=l 



(fojj-fej 

fe u 



Eine EffektgroBe, das heiBt ein MaB fur die GroBe der Assoziation zwischen den 
Variablen, erhalt man, wenn man nach einer strukturgleichen Formel beobachtete 
und erwartete relative Haufigkeiten in Beziehung setzt. 775 



(15-33) 




(rhby-rhej 



rhe ij 



Bortz (1999, S. 153), Hays (1994, S. 858) 

Cohen (1988, S. 216). Dabei gilt jeweils rhcy = fey/N und rhby = fby/N. 
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Zwischen der Teststatistik und der EffektgroBe bestehen einfache Beziehungen: 
(15-34) % 2 = w 2 -N bzw. w = \l% 2 /N . 



Wenn w = 0 ist, sind die beiden nominalen Variablen unabhangig voneinander. Der 
maximale Wert von w hangt von der Mindestzahl der Auspragungen in der Kontin- 
genztafel ab. Haben wir zwei Faktoren mit J und K Auspragungen und ist m die 
kleinere dieser beiden Zahlen, ist der Maximalwert von w gleich vm — 1 . Deshalb 
wird eine standardisierte EffektgroBe definiert, indem w durch diesen Maximalwert 
geteilt wird. Sie entspricht dem Assoziationskoeffizienten von Cramer: 776 



(15-35) 




Diese EffektgroBe liegt zwar stets zwischen 0 und 1, sie entspricht aber keinem 
Korrelationskoeffizienten und lasst sich auch nicht direkt in einen umrechnen. 

Haben beide Variablen genau zwei Auspragungen, reduziert sich die Kontingenz- 
tafel zu einer Vierfeldertafel. In diesem Fall sind die Koeffizienten w und <(>' 
identisch. AuBerdem sind beide Equivalent zu einer Produkt-Moment-Korrelation. 
Diese spezielle Korrelation zwischen zwei Variablen mit jeweils zwei Auspragungen 
wird auch als Pun kt- Vie rfe l de r- K o rrel ati o n - oder Phi-Korrelation bezeichnet. 

Transformationen von Effektgrofien in Korrelationskoeffizienten 

Etliche Teststatistiken, wie z.B. die Rangsumme nach Wilcoxon und das (J)' fur 

Kontingenztafeln mit mehr als vier Feldern, konnen nicht eindeutig in einen 

Korrelationskoeffizienten umgerechnet werden. Um sie dennoch mit anderen 

EffektgroBen vergleichbar zu machen, kann man eine indirekte Transformation fiber 

die Normal verteilung vornehmen. 777 Dazu stellt man fur die ermittelte Teststatistik 
• • 

die Uberschreitungswahrscheinlichkeit p unter der Nullhypothese fest und bestimmt 

• • 

den Wert z einer Standardnormalverteilung, fur den die Uberschreitungswahrschein- 
lichkeit gleich p ist. Eine brauchbare Schatzung fur die EffektgroBe ist dann: 



(15-36) 




Diese indirekte und approximative Umwandlung von EffektgroBen in Korrelations- 
koeffizienten ist fur alle Arten von nicht-parametrischen Test moglich, also z.B. fur 
Chi-Quadrat-Tests auf Unabhangigkeit fur groBere Kontingenztafeln, den U-Test 
zum Vergleich zweier Gruppen und die Rangvarianzanalyse von Friedman. 



776 

777 



Cohen (1988, S. 223), Hays (1994, S. 869) 
Rosenthal (1991, S. 19) 
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0 Die Auswertung der n | + rv = 10 Datenwerte aus Tabelle 15.1 mit dem Rangtest ergibt 
Teststatistiken U = 3 (Mann- Whitney) bzw. T = 13 (Rangsumme nach Wilcoxon) und 
eine exakte einseitige Uberschreitungswahrscheinlichkeit von p = 0,033. In der 
Standardnormalverteilung gehort dieser p-Wert zu z = 1,84. Daraus ergibt sich nach (15- 
36) eine ungefahre EffektgroBe ? von 0,58. Sie liegt zumindest im gleichen Bereich wie 
die Korrelation r = 0,69, die aus der EffektgroBe d bzw. direkt mit der Kodiervariablen 
berechnet wurde. 

15.4.3 Bewertung der GroBe von Effekten 

Da die Abweichungen von der Nullhypothese prinzipiell beliebig klein und beliebig 
groB sein konnen, benotigt man Kriterien fur die Bewertung von empirischen Effekt- 
groBen: 1st eine empirische EffektgroBe, die sich in einer konkreten empirischen 
Untersuchung ergeben hat, eher groB oder eher klein? Oder ist sie gar 
auBergewohnlich hoch oder ungewohnlich gering? Dabei konnen verschiedene 
Gesichtspunkte beriicksichtigt werden. 

In der Regel hangt die adaquate Bewertung der GroBe von Effekten von den 
betrachteten Phanomenbereichen und Zusammenhangen ab. Zum einen werden die 
zu erwartenden EffektgroBen von den betrachteten abhangigen Variablen bestimmt. 

0 Im Allgemeinen lassen sich spezifische Meinungen von Personen (z.B. zur Senkung des 
Wahlalters) leichter und starker beeinflussen als ubergreifende Einstellungen (z.B. zur 
reprasentativen Demokratie). Noch schwerer zu modifizieren sind Personlichkeits- 
merkmale (z.B. Extraversion) oder kognitive Kapazitaten (z.B. Intelligenz). Haben eine 
MaBnahme zur Forderung der Intelligenz und eine MaBnahme zur Anderung einer 
Meinung jeweils einen Effekt von d = 0,50, so ist der hervorgerufene Intelligenz- 
unterschied deshalb inhaltlich bedeutsamer als der numerisch gleich groBe Meinungs- 
unterschied. 

Zum anderen sind bei sehr deutlichen Unterschieden zwischen den untersuchten 
Gruppen groBere Effekte zu erwarten, als wenn zwischen den Auspragungen der 
unabhangigen Variablen kaum spiirbaren Abstufungen bestehen. 

0 Der Effekt der Belohnung auf die Meinungsanderung ist bei Gruppen mit 1 DM, 8 DM 
und 80 DM Belohnung vermutlich groBer als bei 1 DM, 5 DM und 8 DM. 

Die relativen EffektgroBen sind von der Unterschiedlichkeit der Werte innerhalb der 
Gruppen abhangig. Bei d beispielsweise wird die Mittelwertsdifferenz auf die 
gemeinsame Standardabweichung s p relativiert. Unter sonst gleichen Bedingungen 
sind relative EffektgroBen deshalb um so hoher, je kleiner diese sog. Binnen- 
varianzen sind. Diese Binnenvarianz wird in einigen Experimenten gezielt 
verringert: durch Konstanthaltung oder Elimination von Storfaktoren sowie durch 
Einfiihrung weiterer relevanter Faktoren in den Versuchsplan. Dadurch erhohen sich 
die relativen EffektgroBen fur den interessierenden Faktor, ohne dass sich an den 
absoluten Effekten etwas geandert hat. Dies muss bei der Bewertung beriicksichtigt 
werden. 
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Die Bewertung von Effekten kann sich auch an Ergebnissen bisheriger 
Untersuchungen zu ahnlichen Fragestellungen, Variablen oder Zusammenhangen 
orientieren. Sehr nlitzlich sind dafiir die Ergebnisse von Meta- Analy sen. Sie fassen 
die quantitativen Ergebnisse aller (vorliegenden) Untersuchungen zu einer 
bestimmten Fragestellung statistisch zusammen. Dazu werden unter anderem 
Mittelwerte der EffektgroBen liber alle Untersuchungen berechnet. 

0 Eine friihe Meta- Analyse zum Erfolg von psychotherapeutischen Verfahren erbrachte bei 
833 Vergleichen einer Therapie- mit einer Kontrollgruppe aus 375 verschiedenen 

778 

empirischen Studien eine durchschnittliche EffektgroBe von d = 0,68. Dabei waren die 
durchschnittlichen Effekte bei der systematischen Desensibilisierung am groBten und bei 
der Gestalttherapie am kleinsten. Die erwarteten Effekte in nachfolgenden Erfolgs- 
untersuchungen konnen an derartigen Mittelwerten ausgerichtet werden. 

Stehen keine spezifischen Anhaltspunkte zur Verfugung, kann man sich an den 
allgemeinen RichtgroBen orientieren, die Jacob Cohen entwickelt hat. Fur 
verschiedene Arten von Signifikanztests und EffektmaBen hat er dabei jeweils 
Konventionen fur kleine, mittlere und groBe Effekte vorgeschlagen. 

Fur die EffektgroBe d beim t-Test mit unabhangigen Gruppen ist d = 0,20 ein 
kleiner, d = 0,50 ein mittlerer und d = 0,80 ein groBer Effekt. Bei einem mittleren 
Effekt unterscheiden sich die Mittelwerte also um eine halbe Standardabweichung. 

Selbst ein groBer Effekt von 0,80 scheint gering zu sein, da der Mittelwerts- 
unterschied weniger als eine Standardabweichung betragt. Cohens Konventionen 
orientieren sich jedoch an einer Analyse der EffektgroBen, die in verschiedenen 
Bereichen der Verhaltenswissenschaften typischerweise zu finden sind. So haben 
empirische Untersuchungen, die in guten Fachzeitschriften fur klinisch-psycho- 
logische und sozialpsychologische Forschung veroffentlicht worden sind, im Durch- 
schnitt Effekte erbracht, die nach der Klassifikation von Cohen mittelgroB sind. 
Auch Unterschiede, die uns aus der Alltagsanschauung wohlbekannt und deutlich 
erscheinen, bewegen sich in diesem Bereich. 0 

0 Der mittlere Unterschied in der KorpergroBe zwischen 13 und 18 Jahre alten Frauen 
entspricht einem groBen Effekt. Die mittleren IQ-Differenzen zwischen Akademikern, 
Biiroangestellten und angelernten Arbeitern entsprechen jeweils einem mittleren Effekt. 

0 Ein Doppelblindversuch zur Senkung des Herzinfarktrisikos durch Aspirin wurde 1987 
abgebrochen, weil es auf Grand der Zwischenergebnisse ethisch nicht vertretbar schien, 
der Kontrollgruppe statt des wirksamen Medikaments ein Placebo zu geben. Tatsachlich 
war die Wirkung zwar signifikant (bei liber 22000 Probanden), die EffektgroBe betrug 
aber nur r = 0,034, der Varianzanteil also nur 0,1 %. 



Smith & Glass (1977) 

Cohen (1988, 1992) 

Cohen (1988, S. 25-27), Cooper & Findley (1982), Prentice & Miller (1992), Rosenthal 
(1991, S. 135), Sedlmeier & Gigerenzer (1989) 
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Die Empfehlungen fur groBe, mittlere und kleine Effekte fur wichtige Testverfahren 
sind in Tabelle 15.7 zusammengefasst. Zur besseren Vergleichbarkeit sind jeweils 

70 1 

auch die entsprechenden Korrelationskoeffizienten angegeben. 



Tabelle 15. 7: Konventionen fur EffektgroBen bei verschiedenen Tests 782 









Konventionen 


Verfahren 




Index 


klein 


mittel 


groB 


Mittelwertsvergleich 


t-Test 


d 


0,20 


0,50 


0,80 






r 


0,10 


0,24 


0,37 


Varianzanalyse 


F-Test 


f 


0,10 


0,25 


0,40 






T) = R 


0,10 


0,24 


0,37 


Korrelation 


t-Test 


r 


0,10 


0,30 


0,50 


Multiple Regression 


F-Test 


f 


0,14 


0,39 


0,59 






R 


0,14 


0,36 


0,51 


Haufigkeiten 


Binomialtest 


g 


0,05 


0,15 


0,25 






r 


i) 


i) 


i) 


Unabhangigkeit 


% 2 -Test 


w 


0,10 


0,30 


0,50 






r 


2) 


2) 


2) 



0 nur approximative Umrechnung fiber Normalverteilung moglich 

2 ) bei Vierfeldertafel: w = r, sonst nur approximative Umrechnung moglich 



15.4.4 Teststatistik und EffektgroBe 

Allgemein gesagt driicken empirische Effektgrofien die GroBe der Abweichungen der 
empirischen Daten von der Nullhypothese aus. Wie wir in vorangegangenen 
Kapiteln 15.4.1 bis 15.4.3 gesehen haben, sind EffektgroBen stets unabhangig von 
der Anzahl der Untersuchungspersonen definiert. In Teststatistiken hingegen geht 
zusatzlich immer noch Information iiber den Umfang der Untersuchungsgruppen ein. 
Beispielsweise gilt nach (15-23) fur die t-Statistik 



(15-37) 



t = y 2 ~ Yi 

l emp 



M^=d 



n i + n 2 



n l n 2 

n i +n 2 



781 

Bei den Konventionen sind auch die unterschiedlichen Untersuchungsarten und 
Gegenstandsbereiche berucksichtigt. So ist in einer Korrelationsstudie ein r = 0,30 ein 
mittlerer Effekt, in einem Experiment aber schon ein r = 0,24. Prinzipiell sind hohere 
Zusammenhange zu erwarten, wenn beide Variablen frei variieren konnen. Wenn im 
Experiment die realisierten Auspragungen nur einen Teil des moglichen Variations- 
bereiches abdecken, ftihrt diese Einschrankung zu geringeren Assoziationen (restriction 
of range, Bortz, 1999, S. 205-206; Hays, 1994, S. 621). 

782 nach Cohen (1988, 1992, S. 157) 
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Der erste Faktor der t-Statistik ist also gleich der empirischen EffektgroBe d. In den 
zweiten Faktor gehen ausschlieBlich die Umfange n, und n 2 der beiden Unter- 
suchungsgruppen ein. Zusammenfassend haben wir also die folgende konzeptuelle 
Beziehung: 783 

• Teststatistik = EffektgroBe x Untersuchungsumfang. 



Diese Beziehung gilt beispielsweise fur die Teststatistiken (15-29) und (15-30) fur 
die einfache und multiple Korrelation sowie (15-34) fur den Chi-Quadrat-Test. Auch 
die Teststatistik fur die Varianzanalyse in (15-26) kann so umformuliert werden, 
dass sie aus einer EffektgroBe, in (15-28) als f 2 definiert, und einem Faktor fur den 
Untersuchungsumfang besteht: 



(15-38) 



p= QS a J(n-l) _ f2 J(n-l) 



QS 



Fehler 



j-i 



j-i 



An diesem einfachen Aufbau von Teststatistiken lassen sich eine Reihe von 
Zusammenhangen verdeutlichen, die fur die Interpretation statistischer Ergebnisse 
von entscheidender Bedeutung sind, aber oft ubersehen werden. 

Da jede Teststatistik von der EffektgroBe und dem Untersuchungsumfang 
bestimmt wird, kann sie groB und signifikant werden, obwohl nur ein kleiner Effekt 
vorliegt: Die Untersuchungsgruppen miissen nur hinreichend groB sein. Ein 
signifikantes Ergebnis kann also auch auftreten, obwohl die Mittelwertsunterschiede 
sehr klein und inhaltlich nicht bedeutsam sind. 

Die Entscheidungen liber empirische Hypothesen diirfen deshalb nicht nur darauf 
gestutzt werden, ob die Tests der statistischen Hypothesen signifikant sind oder 
nicht. Die empirischen EffektgroBen miissen stets systematisch mit einbezogen 
werden. Strategien zur Entscheidung liber empirische Hypothesen auf Grand von 
Signifikanz und EffektgroBe werden im Kapitel 17 vorgestellt. 



15.5 Kontrolle von Teststarke und Fehlerwahrscheinlichkeit 2. Art 

15.5.1 Teststarke und Fehlerwahrscheinlichkeiten beim Signifikanztest 

Bei einem signifikanten Testergebnis wird die Nullhypothese abgelehnt und die 
Alternativhypothese akzeptiert. Die Wahrscheinlichkeit daflir, dass dies falschlicher- 
weise geschieht, ist hochstens gleich dem Signifikanzniveau a, das iiblicherweise auf 
kleine Werte von 0,05 oder 0,01 festgesetzt wird: Pdf akzeptiert I H 0 zutreffend) < 
a. Diese (recht unwahrscheinlichen) falschlichen Ablehnungen der Nullhypothese 
werden Fehler 1. Art oder a-Fehler genannt. 

Erbringt ein herkommlicher Signifikanztest kein signifikantes Ergebnis, kann man 
nur sagen, dass die Nullhypothese beibehalten oder nicht abgelehnt wird. Eine 



783 



Rosenthal & Rosnow (1985, S. 9) 
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explizite Akzeptierung der Nullhypothese ist nur dann gerechtfertigt, wenn bekannt 
ist, dass auch die Wahrscheinlichkeit fur einen Fehler 2. Art klein ist. 

Ein Fehler 2. Art liegt vor, wenn die Nullhypothese nicht abgelehnt 
(“beibehalten”) wird, obwohl sie falsch und die Alternativhypothese zutreffend ist. 
Die maximale Wahrscheinlichkeit fur einen Fehler 2. Art wird mit (3 bezeichnet: 
P(Beibehaltung von H 0 I Hi zutreffend) < (3. 

Die zur |3- Wahrscheinlichkeit komplementare Wahrscheinlichkeit 1-13 ist die 
Teststdrke oder power des Signifikanztests. Sie ist gleich der Wahrscheinlichkeit, 
dass eine richtige Alternativhypothese auf Grund der Signifikanztestergebnisse 
angenommen wird: P(Akzeptierung von H t I H! zutreffend). Die Definition dieser 
sehr wichtigen GroBen ist in der Tabelle 15.8 zusammengefasst. 

Tabelle 15.8: Priifung statistischer Hypothesen durch Signifikanztests: 

Entscheidungsalternativen und Entscheidungswahrscheinlichkeiten 



Entscheidung 


tatsdchlicher Zustand 
H 0 zutreffend H! zutreffend 


H 0 beibehalten 
Hi akzeptiert 


1-a (3 

a 1 — (3 



Die Tabelle 15.8 gleicht in ihrem Aufbau der Tabelle 13.1 (Seite 292) zur Definition 
der Fehlerwahrscheinlichkeiten e und f. Diese oberflachliche Ahnlichkeit sollte 
jedoch nicht die grundsatzlichen Unterschiede verdecken: In der Tabelle 13.1 geht es 
um die Entscheidung fiber empirische Hypothesen, hier in der Tabelle 15.8 um 
Entscheidungen liber statistische Hypothesen. 

Die Entscheidungen fiber empirische und statistische Hypothesen erfolgen auf 
unterschiedlichen Ebenen, die in verschiedenen Situationen in unterschiedlicher 
Weise miteinander verbunden sind: Wie wir im Kapitel 16 noch naher sehen werden, 
folgt aus der Giiltigkeit der empirischen Hypothese EH in den meisten Fallen, dass 
die statistische Alternativhypothese zutreffend ist. In einigen wichtigen Fallen folgt 
aus der Giiltigkeit einer EH aber auch die Giiltigkeit einer H 0 . Wegen dieser unter- 
schiedlichen Verbindungen zwischen empirischen und statistischen Hypothesen 
diirfen die beiden Ebenen nicht vorschnell gleichgesetzt werden. 784 

Folgen zu geringer Teststarken 

Wenn in einer Untersuchung die Wahrscheinlichkeit (3 fur Fehler 2. Art groBer und 
die Teststarke 1 -(3 dementsprechend kleiner wird, nimmt die Wahrscheinlichkeit 
zu, dass der Signifikanztest insignifikant bleibt, obwohl die Alternativhypothese 
zutreffend ist. Die Validitat der Entscheidung fiber die empirische Hypothese wird 



zur genauen Abhangigkeit der Wahrscheinlichkeiten e und f fur Fehlentscheidungen 
iiber empirische Hypothesen von den statistischen Fehlerwahrscheinlichkeiten a und (3: 
Erdfelder & Bredenkamp (1994, S. 616-622) 
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dadurch vermindert. Im iiblichen Fall, dass die Alternativhypothese aus der 
empirischen Hypothese folgt, wird das Risiko erhoht, eine zutreffende empirische 
Hypothese abzulehnen. Je hoher (3 ist, desto hoher ist in diesem Fall also, unter sonst 
gleichen Bedingungen, die Fehlerwahrscheinlichkeit f fur falschliche Ablehnungen 
der empirischen Hypothese. 

In Untersuchungen mit zu geringer Teststarke ist also Iiblicherweise die Chance 
vermindert, substanzwissenschaftliche Hypothesen empirisch zu bestatigen. Sie sind 
aber auch nicht geeignet, wissenschaftliche Hypothesen zu erschuttern, denn 
insignifikante Ergebnisse konnen allein durch die zu geringe Teststarke zustande 
gekommen sein und miissen nicht unbedingt darauf hindeuten, dass die empirische 
Hypothese falsch ist. Wir verschwenden also Ressourcen, wenn wir eine 
Untersuchung mit einer zu geringen Teststarke durchfuhren: “low power is poor 

„ 785 

science . 

Die Bedeutung des Fehlers 2. Art und der Teststarke wird in der Fachliteratur 
schon seit Jahrzehnten betont. In der Forschungspraxis sind p-Fehler und 
Teststarke aber straflich vernachlassigt worden, und zwar sowohl von den Forschern 
und Autoren als auch von den Herausgebern und Gutachtern. Erst allmahlich 
werden diese Konzepte auch in Lehrbuchern der angewandten Statistik und der 
experimentellen Versuchsplanung berticksichtigt. 8 

In den folgenden Kapiteln wird ausflihrlich dargestellt, wie fur eine vorliegende 
Untersuchung die Teststarke nachtraglich bestimmt werden kann (. Post-hoc - 
Teststdrkeanalyse). Vor allem aber wird gezeigt, wie wahrend der Untersuchungs- 
planung daftir gesorgt werden kann, dass die Teststarke hinreichend groB wird ( A - 
priori-Teststdrkeanalyse) . 



15.5.2 Voraussetzungen ftir die Bestimmung von Teststarken 

Generell setzt die Bestimmung von Fehlerwahrscheinlichkeiten voraus, dass man 

einen prazisen Wert ftir den betrachteten Parameter annimmt. 

Die Bestimmung von a, der maximalen Wahrscheinlichkeit fiir einen Fehler 1. 

• • 

Art, und von p, der tatsachlichen Uberschreitungswahrscheinlichkeit, erfolgt bei 
parametrischen Tests fiir den Fall, dass die sog. exakte Nullhypothese gilt, d.h. dass 
der betrachtete Parameter bzw. die betrachtete Parameterdifferenz genau gleich Null 
ist. 789 Einige Beispiele fiir exakte Nullhypothesen sind: 

(15-39) (i 1 -|a 2 =0 (t-Test fiir unabhangige Gruppen) 



,OJ Keppel (1991, S. 73) 

786 

in der mathematischen Statistik: Neyman & Pearson (1936, 1938a, 1938b), in der 
Psychologie: Hays (1963), Cohen (1965), Bredenkamp (1969b) 

787 Cohen (1962), Hager & Westermann (1982), Sedlmeier & Gigerenzer (1989) 

788 Bortz (1999), Keppel (1991), Winer et al. (1991), Wilkinson et al. (1999) 

789 

Statt 0 kann auch ein anderer fester Wert c angenommen werden (siehe oben FuBnote 
687, Seite 322). 
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(15-40) p = 0 (t-Test der Korrelation zweier Variablen) 

(15-41) ja i = ja 2 = P 3 = M 4 (Varianzanalyse liber vier Gruppen). 

Bei ungerichteten Alternativhypothesen (wie bei der Varianzanalyse und bei 
zweiseitigen t-Tests) sind die exakten Nullhypothesen genau gleich den geprtiften 
Nullhypothesen. Bei gerichteten Alternativhypothesen (wie beim einseitigen t-Test 
mit H| : p, — p 2 > 0) bezeichnet eine exakte Nullhypothese denjenigen Parameter- 
wert, der genau die Grenze zur Alternativhypothese bildet. 



Annahme von Effektgrofien 



Auch um bestimmte Werte fur (3 und 1 — (3 zu bestimmen, muss ein bestimmter 
Parameterwert angenommen werden. Im Unterschied zur Nullhypothese gibt es 
jedoch keine eindeutig hervorgehobene exakte Alternativhypothese. Beispielsweise 
kann unter der Hp p, -p 2 > 0 die Differenz zwischen den beiden Erwartungswerten 
beliebig klein und beliebig groB sein. Fur jede dieser Abweichungen von der 
Nullhypothese ergibt sich ein anderer Wert fur die Fehlerwahrscheinlichkeit (3: Sie 
wird um so kleiner, je groBer die tatsachliche Differenz der Parameter ist. Will man 
eindeutige Werte fur (3 und l-(3 bestimmen, muss man deshalb ein bestimmtes 
AusmaB an Abweichung von der Nullhypothese annehmen. 

Diese angenommene Abweichung ist eine Annahme liber die tatsachliche 
EffektgroBe, die auch als Populationseffekt bezeichnet wird. Der tatsachliche Effekt 
beim Vergleich von zwei Gruppen ist analog zum empirischen Effekt d definiert: 790 

(15-42) 8= ~M-i 

a 



Diese standardisierte Mittelwertsdifferenz kann einfach in 

7Q t 

umgerechnet werden: 



(15-13) 




eine 



Korrelation 



Fiir einige ausgewahlte Werte von 8 sind die entsprechenden Korrelationen in 
Tabelle 15.9 aufgefiihrt. Ein 8 = 0,50 beispielsweise entspricht danach p = 0,243, p 2 
= 0,059 und damit 5,9% gemeinsamer Varianz. 



nach Cohen (1988, S. 20). Von Bortz (1999, S. 119-120) wird diese EffektgroBe als £ 
bezeichnet. Die EffektgroBe 5 ist nicht zu verwechseln mit dem oft auch als 8 
bezeichneten Nichtzentralitatsparameter der t-Verteilung, der auch von der GroBe der 
Untersuchungsgruppen abhangt (Hays, 1994, S. 329) und z.B. im Teststarkeprogramm 
GPOWER berechnet wird (Buchner, Erdfelder & Faul, 1996, S. 126). 

791 

nach Cohen (1988, S. 24). Zu beachten ist, dass diese Beziehung nur fiir Populationen 
gilt. Eine einfache Ubertragung auf Stichprobendaten (z.B. bei Fricke & Treinies, 1985, 
S. 110) erbringt etwas zu niedrige Korrelationsschatzungen. 
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Tabelle 15.9: Korrelationen p, Varianzanteile p 2 und Prozentrange PR fur 

verschiedene standardisierte Mittelwertsdifferenzen 8 792 



5 


P 


P 2 


PR 


0,00 


0,000 


0.000 


50,0 


0,20 


0,100 


0,010 


57,9 


0,50 


0,243 


0,059 


69,1 


0,80 


0,371 


0,138 


78,8 


1,00 


0,447 


0,200 


84,1 


1,50 


0,600 


0,360 


93,3 


2,00 


0,707 


0,500 


97,7 



Wenn die Variablen normalverteilt sind, konnen EffektgroBen in MaBe fur die 
• • 

Uberlappung der Verteilungen in den beiden Gruppen umgerechnet werden. Am 
anschaulichsten ist es dabei, fur eine (hypothetische) Person, die genau auf dem 
Mittelwert der Gruppe mit den tendenziell hoheren Werten liegt, den prozentualen 
Rangplatz anzugeben, den sie in der niedrigeren Gruppe hatte. Diese Prozentrange 
sind in der Tabelle 15.9 in der Spalte PR angegeben. 

0 In einem Experiment habe die Behandlungsgruppe erwartungsgemaB die tendenziell 
hoheren Werte. Eine Person, die genau am Mittel der Behandlungsgruppe liegt (also dort 
einen Prozentrang 50 hat), hat bei einem Effekt von 8 = 0,50 einen hoheren Wert als 69% 
der Kontrollgruppe (dort also einen Prozentrang von 69). Bei einem Effekt von 5 = 0,20 
hingegen lage sie in der Kontrollgruppe nur auf Prozentrang 58. 

Kriterien fiir die Annahme von Effekten 

Sollen fur einen Signifikanztest in einer empirischen Untersuchung Teststarke und (3- 
Wahrscheinlichkeit ermittelt werden, muss nach dem eben Gesagten eine Annahme 
fiber die tatsachliche EffektgroBe getroffen werden. Diese angenommene Effektgrofie 
kann eine erhaltene, gewunschte, erwartete oder konventionelle GroBe sein. 

• Hat man die Untersuchung bereits durchgefiihrt und ausgewertet, kann man die 
Teststarke fur den Fall bestimmen, dass der tatsachliche Effekt gleich der 
empirisch erhaltenen EffektgroBe, also z.B. gleich dem empirischen Wert von d 
ist. 

• In manchen Untersuchungsbereichen konnen EffektgroBen spezifiziert werden, 
die mindestens erreicht werden mussen, damit der Mittelwertsunterschied oder die 
Variablenassoziation praktisch bedeutsam ist. 793 

9 Der Erfolg eines Gesundheitsforderprogramms einer Betriebskrankenkasse wird 
untersucht, indem eine Behandlungs- und eine Kontrollgruppe verglichen werden. 



nach Cohen (1988, S. 22) 

793 

EffektgroBen werden auch als MaBe der praktischen Bedeutsamkeit oder praktischen 
(im Gegensatz zur statistischen) Signifikanz bezeichnet (Bredenkamp, 1970). Damit ist 
auch die Bedeutsamkeit fiir die wissenschaftliche Erkenntnis gemeint. 






372 



Kapitel 15 



Nach Auffassung der Experten und des Vorstands ist die Fortfiihrung des aufwendigen 
Programms nur dann vertretbar, wenn der Krankenstand um mindestens drei Tage im 
Jahr reduziert wird. Es ist dann sinnvoll, (3 und 1 - (3 fur den Fall festzustellen, dass 
der tatsachliche Effekt von dieser absoluten GroBe ist. 1-P gibt dann die 
Wahrscheinlichkeit an, dass der t-Test bei einem tatsachlichen Unterschied von drei 
Krankheitstagen signifikant wird. 

• Sowohl vor wie nach einer Untersuchung kann man die Teststarke fur die Effekt- 
groBe bestimmen, die man auf Grund seiner Fachkenntnisse in dem untersuchten 
Gegenstandsbereich und der Ergebnisse vergleichbarer Untersuchungen erwartet 
(siehe Kapitel 15.4.3). 

• Stehen iiberhaupt keine spezifischen Anhaltspunkte fur die Annahme einer 
EffektgroBe zur Verfiigung, kann man sich an den Konventionen von Cohen fiir 
kleine, mittlere und groBe Effekte orientieren (siehe Kapitel 15.4.3). 

Die Teststarke l-(3, die fiir eine bestimmte angenommene EffektgroBe ermittelt 
werden kann, gibt in jedem Fall die Wahrscheinlichkeit an, mit der der Test 
signifikant wird, falls diese angenommene EffektgroBe tatsachlich vorliegt. Ist die 
tatsachliche EffektgroBe groBer als die angenommene, ist auch die tatsachliche 
Teststarke groBer als die ermittelte. Die angenommene EffektgroBe ist also ein 
Mindesteffekt : der Effekt, fiir den die Teststarke mindestens I - P betragt. 

15.5.3 Funktionale Bestimmung der Teststarke fiir t-Tests 

Die numerische Berechnung von P- Wahrscheinlichkeit und Teststarke fiir einen t- 
Test setzt nicht nur voraus, dass man einen bestimmten Wert 8 a fur die tatsachliche 
EffektgroBe 8 annimmt, sondern auch, dass man die Verteilung der Teststatistik fiir 
den Fall kennt, dass nicht die exakte H 0 : p 2 _ Ti = If sondern die spezifizierte If: 
\h~\k = S a gilt- 

Die Verteilungen von Teststatistiken unter Giiltigkeit der Alternativhypothese 
weichen in aller Regel von der Verteilungsform ab, die die Teststatistik unter der 
exakten Nullhypothese hat. Beispielsweise hat die t-Statistik bei Giiltigkeit der 
Alternativhypothese nicht die bekannte und gut tabellierte t- Verteilung, sondern folgt 
sog. nicht-zentralen t- Verteilungen. Diese Abweichung stellt aber fiir die 
Anwendung kein ernsthaftes Problem dar, denn die nicht-zentralen Verteilungen 
konnen in der Regel gut durch eine Normalverteilung oder andere zentrale 
Verteilungen approximiert werden. Um das Prinzip verstandlich zu machen, wird 
dies am Beispiel demonstriert. Im folgenden Kapitel werden wir sehen, dass P und 
1 — P auch sehr einfach aus speziellen Tabellen abgelesen werden konnen. 



794 Diese Werte haben sich zwar gut bewahrt, konnen aber wie alle Konventionen fiir 
bestimmte Untersuchungsbereiche zu hoch, zu niedrig oder zu wenig differenziert sein. 
195 Hays (1994, S. 328-330), Rasch (1995, S. 169) 
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0 In einem Experiment zur Belohnung fur einstellungskontrares Verhalten (ahnlich dem 
von Frey und Irle) leiten wir wieder die empirische Vorhersage y 2 > y, ab (siehe Seite 
286): Die Meinungen (abhangige Variable Y, gemessen durch Summe aus zwei 
Antworten) sollen unter 50 DM Belohnung (A2) positiver sein als unter 10 DM (Ai). 

In jeder Bedingung werden 35 Personen untersucht. Die Mittelwerte seien y, = 10 
und y 2 = 11,3, die Varianzen =17 und s 2 =15. GemaB (15-11) ist die gemeinsame 
Varianz dann Sp=16, die empirische EffektgroBe nach (15-19) ist d = 0,325. Der 
Standardfehler der Differenz der Stichprobenmittelwerte nach (15-12) ist Sy y = 0,956. 

Bei Gultigkeit der exakten Nullhypothese ist die Stichprobenkennwerte- Verteilung der 
Mittelwertsdifferenzen approximativ eine Normal verteilung mit dem Erwartungswert 0. 
Als Standardabweichung nehmen wir fur unseren Fall den Schatzwert 0,956 an. Die 
resultierende Verteilung ist in der Abbildung 15.2 durch die linke Kurve reprasentiert. 

Der empirische Wert der Teststatistik ist nach (15-13) t emp = 1,36. Bei n 1 + n 2 -2 = 68 
Freiheitsgraden ist die Uberschreitungswahrscheinlichkeit p = 0,09. Die gleiche 
Uberschreitungswahrscheinlichkeit ergibt sich, wenn wir t emp als approximativ standard- 
normalverteilt betrachten. Fur a = 0,05 ist der Test damit nicht signifikant. 

Dies kann man auch daran ablesen, dass t emp kleiner ist als die kritischen Werte fur 

das einseitige Signifikanzniveau 0,05. Diese betragen fur die t- Verteilung mit 68 

796 

Freiheitsgraden etwa to, 95 = 1,67 und fur die Normal verteilung zq ,95 = 1,645. 

Die Nichtsignifikanz kommt auch dadurch zum Ausdruck, dass die tatsachliche 
empirische Mittelwertsdifferenz von y 2 -y^ - 1,3 (vgl. Abbildung 15.2) kleiner ist als 
die kritische Mittelwertsdifferenz. Diese ergibt sich aus der Multiplikation des kritischen 
z-Wertes mit dem Standardfehler und ist in der Abbildung eingezeichnet: 

(15-44) (y 2 - yOkrit = Z 0 95 • s ?i _ ?2 = 1,645 • 0,956 = 1,573 



Wahrscheinl.- 




Abbildung 15.2: Stichprobenkennwerte-Verteilungen von Mittelwertsdifferenzen 

unter der Null- und einer Alternativhypothese 



796 



Bortz (1999, Tabelle D und B) 
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Die Teststarke kann ermittelt werden, wenn wir eine Annahme liber die tatsachliche 
GroBe des Effektes machen. Beispielsweise konnen wir annehmen, dass der tatsachliche 
Effekt mittelgroB ist, d.h. S a = 0,5. 

Die beste Schatzung fur die theoretische Standardabweichung a ist die Wurzel aus der 
gemeinsamen Stichprobenvarianz, in unserem Fall also s p = 4. Der angenommene Effekt 
S a = 0,5 entspricht deshalb einer angenommenen absoluten Mittelwertsdifferenz von 

P'2 -M-1 =2. 

Bei Giiltigkeit dieser exakten Alternativhypothese hat die Mittelwertsdifferenz 
annahernd eine Normalverteilung mit dem Mittelwert u : - u =2 und der Standard- 
abweichung 0,956 (rechte Kurve in der Abbildung 15.2). Unter Giiltigkeit der exakten 
Nullhypothese wurde oben eine kritische Mittelwertsdifferenz von 1,573 bestimmt, die 
unter der Nullhypothese einem z-Wert von / L . n , = 1,645 entspricht. Unter der exakten 
Alternativhypothese gehort zu dieser kritischen Mittelwertsdifferenz der folgende z-Wert: 

1,573-2 

(15 — 45) z = — = -0,447 

0,956 

Die Verteilungsfunktion der Standardnormalverteilung hat bei z = -0,447 einen Wert von 
etwa 0,33. Dies entspricht der Wahrscheinlichkeit (3 fur einen Fehler 2. Art und in der 
Abbildung dem Anted der Flache unter der HpVerteilung, der links von der kritischen 
Grenze liegt. Die Teststarke 1 - (3 betragt nach dieser Annaherung also 0,67. 

15.5.4 Approximative Teststarke fur Permutationstests 

Wie wir gesehen haben, muss fur die genaue Bestimmung eines Wertes 1 - (3 bzw. (3 
die Alternativhypothese genauer spezifiziert werden: Man muss einen quantitativen 
Wert fur die Abweichung von der Nullhypothese (Effektgrol3e) und fur diese 
Abweichungssituation eine Stichprobenkennwerte-Verteilung annehmen. Beides ist 
bei parametrischen Tests relativ problemlos moglich. 

Bei Permutationstests (siehe oben Kapitel 15.3) ist die Menge der moglichen 
Abweichungen jedoch so heterogen, dass sich das AusmaB der Abweichungen nicht 
in einheitlicher und vergleichbarer Weise ausdrticken lasst. 797 Damit ist eine 
vollstandige Bestimmung der Teststarke nicht moglich. Der Einfachheit halber wird 
die Menge der Alternativsituationen deshalb auf die Untermenge der Situationen 
eingeschrankt, die sich von der Nullhypothese ausschliel31ich durch ihre Lage 
unterscheiden. 798 Die Teststarke lasst sich dann durch die Teststarke approximieren, 
die fur entsprechende parametrische Tests ermittelt wird. 799 

0 Fur den kleinen Datensatz zum Permutationstest in Tabelle 15.1 (Seite 339) haben wir als 
beste Schatzung fur die gemeinsame Standardabweichung a nach (15-11) s =10,67 

797 

Sie umfasst alle Situationen, bei denen UV und AV nicht unabhangig und folglich die 
moglichen Aufteilungen der Daten nicht gleichwahrscheinlich sind. 

798 Auch bei parametrischen t-Tests umfassen die Alternativhypothesen nur die Falle, in 
denen sich die Normal verteilungen der AV in den Gruppen ausschlieBlich in ihren 
Mittelwerten unterscheiden. 

799 Bredenkamp (1980, S. 62), Willmes (1987, S. 252- 285) 
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errechnet. Der Standardfehler betrug nach (15-12) s Y| y = O.NV . Ein angenommener 
Effekt von 5 a = 0,80 entspricht dann einer angenommenen Mittelwertsdifferenz: 

(15 — 46) (p 2 -p 1 ) a = 8 a 0 = O,8OlO,67 = 8,54 

Nach (15 — 44) ist die kritische Mittelwertsdifferenz: 



(15-47) (y 2 - Yi )krit = z o ,95 -Syj-yj =1 >645 • 6,89 =11,33 . 

Zu dieser kritischen Mittelwertsdifferenz berechnen wir nach (15 — 45) einen z-Wert unter 
der exakten Alternativhypothese: 



(15-18) 



11,33-8,54 
Z_ M9 



= 0,405. 



Die Verteilungsfunktion der Standardnormalverteilung hat fur dieses z einen Wert von 
0,66. Die Teststarke liegt also nur bei etwa 0,34. Wie unserer Beispiel zeigt, kann bei 
einer sehr groBen Mittelwertsdifferenz der Test trotzdem signifikant werden. 



Die moglichen Abweichungen der (unbekannten) tatsachlichen Fehlerwahrschein- 
lichkeiten und Teststarken von den Approximationsergebnissen mtissen uns nicht 
beunruhigen, weil sie meist nicht zu anderen Entscheidungen iiber die inter- 
essierenden wissenschaftlichen Hypothesen fiihren. 



15.5.5 Tabellarische Bestimmung von Teststarken 

Zur genauen und einfachen Bestimmung von Teststarke und Fehlerwahrschein- 
lichkeit 2. Art gibt es fur die wichtigsten Testverfahren spezifische Tabellen. 1 Zur 
Veranschaulichung des Aufbaus und der Benutzung dieser Teststarketabellen sind in 
unserer Tabelle 15.10 einige Teststarken fur den Fall eines einseitigen t-Test fur 
unabhangige Gruppen mit a =0,05 angegeben. 



800 

Um Uberschatzungen zu vermeiden, kann der approximierte Wert mit der asympto- 
tischen relativen Effizienz (ARE) multipliziert werden, die z.B. fur den gangigen 
Wilcoxon-Mann- Whitney-Test bei 0,95 liegt (Bredenkamp, 1980, S. 61-62; Marascuilo 
& McSweeney, 1977, S. 77-91). 

801 Sehr gut erklarte und einfach zu benutzende Tabellen fur die wichtigsten Tests enthalt 
das Buch von Cohen (1988). Kurzfassungen: Cohen (1992), zum Teil ausfuhrlicher, 
aber weniger benutzerfreundlich: Hager (1987), Hager & Moller (1986). 

Zur einfachen und genauen Bestimmung von Teststarken sind auch etliche 
Programme auf dem Markt, z.B. SAMPLEPOWER (www.spss.com), PASS 
(www.ncss.com) und GPOWER (Buchner et al., 1996; Erdfelder, Faul & Buchner, 1996), 
das unter www.psychologie.uni-trier.de:8000/projects/gpower.html kostenlos bezogen 
werden kann. 

In SPSS wird die Teststarke innerhalb des Allgemeinen linearen Modells ermittelt 
(Option “beobachtete Scharfe“). Als Effekt wird der empirische Wert von T| 
angenommen. Fur andere Effekte kann die Teststarke nicht bestimmt werden. 
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Tabelle 15.10: Teststarken: t-Test fur unabhangige Gruppen (a = 0,05, 

einseitig) 802 



n i = n 2 


dcrit 


.20 


5 a 

.50 


o 

oo 

• 


10 


.78 


.11 


.29 


.53 


20 


.53 


.15 


.46 


.80 


35 


.40 


.21 


.67 


.95 


50 


.33 


.26 


.80 


.99 


80 


.26 


,35 


.93 


>.99 


120 


.21 


.46 


.99 


>.99 



0 Fur unser Beispiel mit n = n 2 =35 und einem angenommenen Effekt von 5 a = 0,50 lesen 
wir aus dieser Tabelle 1-P = 0,67 ab. Dieser Wert stimmt mit dem Ergebnis der 
Normalverteilungsapproximation auf Seite 374 iiberein. 

In der Spalte d cr i t der Tabelle 15.10 sind die empirischen EffektgroBen angegeben, 
die mindestens erreicht werden mtissen, damit der Test signifikant ist. 

0 Fur 35 Personen muss nach Tabelle 15.10 der empirische Effekt mindestens 0,40 
betragen, damit der Test signifikant wird. Bei der ermittelten gemeinsamen Standard- 
abweichung s = 4 muss die absolute Mittelwertsdifferenz demnach mindestens gleich 
1,6 sein, um signifikant zu werden. fiber die Normalverteilungsapproximation hatten wir 
in (15 — 44) gerundet den gleichen Wert errechnet. 

Wie in der Tabelle 15.10 deutlich wird, hangt die Teststarke unter sonst gleichen 
Bedingungen stark von der Anzahl der untersuchten Falle ab. 

6 Bei 80 Personen pro Gruppe betragt die Teststarke fur einen mittelgroBen Effekt 0,93 
statt 0,67 bei 35 Personen. 

Die Teststarke hangt auch vom gewahlten Signifikanzniveau a ab. Je kleiner a ist, 
desto extremer sind die kritischen Werte fur die Teststatistik. Dadurch wird die 
Wahrscheinlichkeit P groBer und die Teststarke 1 - P wird kleiner. 

6 Bei n : = n 2 = 35 und 8 a = 0,50 ergibt sich bei a = 0,01 (statt a = 0,05) ein Absinken der 
Teststarke auf 0,38, und fur a = 0,10 ergibt sich ein Anstieg auf 0,79. 

Auch wenn wir statt einseitig zweiseitig testen, sinkt die Teststarke, weil der 
Rejektionsbereich in der Richtung des angenommenen Effektes halbiert wird. 

9 Bei nj = n 2 = 35 und 8 a = 0,50 sinkt 1-P von 0,67 (einseitig) auf 0,54 (zweiseitig). 
Teststdrkefunktionen 

Wir konnen die Teststarke auch fitr andere angenommene EffektgroBen bestimmen. 



802 



Auszug aus Tabelle 2.3.2 von Cohen (1988) 
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0 Aus Tabelle 15.10 sehen wir, dass bei einem kleinen tatsachlichen Effekt (8 = 0,20) der 
t-Test nur mit einer geringen Wahrscheinlichkeit zu einem signifikanten Ergebnis fiihrt 
(1 — (3 = 0, 21). GroBe Effekte ( 8 = 0, 80 ) hingegen werden mit hoher Wahrscheinlichkeit 
( 1 — P = 0, 95 ) entdeckt. In unserem Fall ist also die (3- Wahrscheinlichkeit des t-Tests fur 
groBe Effekte genau so klein wie die a- Wahrscheinlichkeit (a = (3 = 0,05). Ist der 
tatsachliche Effekt noch groBer als 8 = 0, 80 , wird (3 kleiner als a. 

Bestimmen wir die Teststarke fiir alle moglichen EffektgroBen und tragen diese 
Tests tarkewerte in einem Diagramm als Funktion der EffektgroBe ein, erhalten wir 
die Teststdrkefunktion oder Operationscharakteristik unseres Tests. Diese S- 
formige Funktion charakterisiert die Fahigkeit dieses Tests, unzutreffende Null- 
hypothesen abzulehnen. 

15.5.6 Testplanung 

• • 

Wie an den Uberlegungen im vorangegangenen Kapitel 15.4 deutlich geworden ist, 
hangen die Wahrscheinlichkeit fiir einen Fehler 2. Art und die Teststarke in 
systematischer Weise von drei Faktoren ab: dem gewahlten Signifikanzniveau, der 
tatsachlichen EffektgroBe und der realisierten GruppengroBe. 

Wenn jeweils alle anderen Faktoren konstant sind, ist die Teststarke 1 - B um so 
groBer (d.h. die Fehlerwahrscheinlichkeit (3 um so kleiner), 

• je groBer das Signifikanzniveau a, 

• je groBer die tatsachliche EffektgroBe 8 und 

• je groBer die Anzahl N = ^ + n 2 der untersuchten Falle ist. 

Im vorangegangenen Kapitel hatten wir a posteriori Teststarke und (3-Wahrschein- 
lichkeit bestimmt, d. h. fiir eine durchgefiihrte Untersuchung mit bestimmter Fallzahl 
N und festgesetztem Signifikanzniveau a. Die Werte fiir (3 und 1 — (3 hangen dann 
nur noch von der EffektgroBe ab. Sie liegen also eindeutig fest, wenn wir 
beispielsweise annehmen, dass der tatsachliche Effekt mittelgroB nach den 
Konventionen von Cohen ist. Insbesondere wenn diese Teststarke zu gering ist, tritt 
die Frage auf, wie eine befriedigende Teststarke erreicht werden kann. 

Durch eine Erhohung von a kann die Teststarke nur sehr begrenzt vergroBert 
werden. Ein Signifikanzniveau iiber a = 0,05 verstoBt gegen die Konvention, die 
auch in der Psychologie allgemein akzeptiert ist. 04 

Nehmen wir einen groBeren Effekt an, beispielsweise 8 a = 0,80 statt 0,50, 
bekommen wir fiir diesen angenommenen Effekt eine hohere Teststarke heraus. 
Dieser Zahlenwert ist dann sachgerecht, wenn der groBere Effekt inhaltlich 



vgl. Bortz (1999, S. 124-125), Hays (1994, S. 292), Fisz (1970, S. 631) 

804 Es kann auch sehr gute Grtinde geben, mit einem Signifikanzniveau von iiber 0,05 zu 
arbeiten. So ist es sinnvoll, a = (3 = 0,10 (oder gar 0,20) zu setzen, wenn Fehler erster 
und zweiter Art gleich schwerwiegend erscheinen, die Zahl der Untersuchungseinheiten 
aber nicht ausreicht, um sowohl a wie (3 auf 0,05 zu halten. 
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gerechtfertigt ist, wenn wir also beispielsweise die experimentelle Behandlung 
durchschlagskraftiger gestalten oder die Unterschiede zwischen den Bedingungen 
vergroBern. Statistisch andert sich an der Teststarke durch die Annahme eines 
groBeren Effektes aber gar nichts. Fur bestimmte Werte von a und N liegt die 
funktionale Abhangigkeit der Teststarke von der EffektgroBe (die Operations- 
charakteristik des Tests) eindeutig fest. Wir lesen die Funktionswerte 1 - (3 lediglich 
fur unterschiedliche Auspragungen von 8 a ab. 

Im Allgemeinen ist deshalb die VergroBerung der Personenzahl die beste 
Moglichkeit, die Teststarke tatsachlich zu erhohen. Deshalb ist es unbedingt 
notwendig, vor der Durchfuhrung einer wissenschaftlichen Untersuchung die GroBe 
der Untersuchungsgruppen gezielt so zu planen, dass der durchzufuhrende 
statistische Test eine ausreichende Teststarke hat ( Testplanung oder A-priori- 
Teststdrkebestimmung). 

0 In unserem dissonanztheoretischen Experiment mit zwei Belohnungsgrappen ware es 
wiinschenswert, wenn fur mittlere Effekte die (3-Wahrscheinlichkeit ebenso wie die a- 
Wahrscheinlichkeit hochstens gleich 0,05 ware. Wie bereits aus unserer Tabelle 15.10 
hervorgeht, miissen dazu nicht 35 Personen untersucht werden, sondern mehr als 80. 

Stichprobengrofientabellen 

Fur die genaue und direkte Bestimmung der erforderlichen Fallzahl gibt es eine 
zweite Art von Tabellen, die Stichprobengrofientabellen , deren Struktur in der 
Tabelle 15.11 verdeutlicht wird. 

0 Fur unsere Vorgaben (a = 0,05; (3 = 0,05; 5 a = 0,50) wiirden wir 87 Personen pro Gruppe 
benotigen. 

Tabelle 15.11: Notwendige GruppengroBen beim t-Test fur unabhangige Gruppen 

(a = 0,05, einseitig) 805 



1-B 


.20 


5a 

.50 


O 

OO 

• 


.50 


136 


22 


9 


.70 


236 


38 


15 


.80 


310 


50 


20 


.90 


429 


69 


27 


.95 


542 


87 


35 


.99 


789 


127 


50 



Fiir die wichtigsten Signifikanztests lassen sich die notwendigen Fallzahlen sowohl 
durch entsprechende Tabellen wie durch Computerprogramme planen. 806 Dabei sind 
die benotigten GruppengroBen unter sonst gleichen Bedingungen um so groBer 



805 



Auszug aus der Tabelle 2.4.1 von Cohen (1988). 
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• je kleiner das gewiinschte Signifikanzniveau a ist, 

• je kleiner die angenommene EffektgroBe 8 a ist und 

• je groBer die gewiinschte Teststarke 1 — B ist, mit der Effekte der GroBe 8 a als 
signifikant entdeckt werden sollen. 

Festlegung der Determinanten 

Um die optimale Anzahl von Fallen zu bestimmen, die untersucht werden sollen, 
muss man vorher bestimmte Werte fur a, 8 a und 1 - (3 festlegen. 

Das Signifikanzniveau a wird per Konvention in der Regel nicht groBer als 0,05 
gewahlt. Falls ein Fehler 1. Art besonders schwerwiegend ist, konnen auch kleinere 
Signifikanzniveaus (z.B. 0,01 oder gar 0,001) verwendet werden. 

Die von Cohen vorgeschlagenen Konventionen fiir kleine, mittlere und groBe 
Effekte (siehe Tabelle 15.7) sind inzwischen gut etabliert, aus inhaltlichen Griinden 
kann man aber auch von ihnen abweichen (siehe oben Kapitel 15.4.3). 

Als Konvention fiir die Teststarke wird haufiger 0,80 genannt. 7 Dadurch werden 
(beim konventionellen a = 0,05) Fehler 1. Art fiinfmal so schwer gewichtet wie 
Fehler 2. Art. Dies ist jedoch nicht gerechtfertigt, da auch Fehler 2. Art zu Fehl- 
entscheidungen iiber empirische Hypothesen fiihren konnen. 808 Deshalb sollte 
iiblicherweise a = (3 gewahlt werden, wenn nicht besondere inhaltliche Griinde fiir 
eine unterschiedliche Gewichtung der Fehler 1. und 2. Art sprechen. 

Kompromisslosungen 

Nicht selten ist Anzahl von Untersuchungsfallen, die nach dem Ergebnis einer 
adaquaten Testplanung notwendig ist, so groB, dass sie gar nicht oder nur sehr 
schwer zu realisieren scheint. In diesem Fall muss man versuchen, realisierbare 
Kombinationen von N, a, (3 und 8 a zu finden, die noch akzeptabel erscheinen. Da a 
in aller Regel nicht groBer als der konventionelle Maximalwert 0,05 werden soli, 
sind mit Hilfe der erwahnten Tabellen oder Programme zwei Punkte zu klaren: 



806 Sehr leicht benutzbare sample size tables finden sich bei Cohen (1988). Auch mit den 
Programmen SAMPLEPOWER, PASS und GPOWER (siehe FuBnote 801, Seite 375) kann 
die optimale UntersuchungsgroBe bestimmt werden. 

807 Cohen (1988, S. 55-56), Keppel (1991, S. 75), Bortz (1999, S. 126) 

808 Um falsche empirische Hypothesen als falsch identifizieren zu konnen, muss man 
zutreffende Nullhypothesen akzeptieren konnen (siehe unten Kapitel 16). Die Wahr- 
scheinlichkeit (3 einer falschlichen Akzeptierung der Nullhypothese ist deshalb in der 
Regel ebenso wichtig wie die Fehlerwahrscheinlichkeit a. Kann die fiir kleine a- und (3- 
Werte notwendige Personenzahl nicht realisiert werden (d.h. im Beispiel nicht 87, 
sondern nur 35 Personen pro Gruppe untersucht werden), kann man dennoch bei a = (3 
= 0,05 bleiben, wenn man anerkennt, dass die Teststarke 0,95 nicht fiir mittlere, sondern 
fiir groBe Effekte gilt (vgl. Tabellen 15.10 und 15.11). Fiir unsere Vorgaben (a = 0,05; 
(3 = 0,05; S a = 0,50) wiirden wir 87 Personen pro Gruppe benotigen. 
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1. Welche Teststarke hat der Test fur verschiedene realisierbare Fallzahlen, um den 
eigentlich gesetzten Mindesteffekt 8 a zu entdecken? 809 

2. Welchen Effekt 8 kann man fiir diese Fallzahlen jeweils mit der eigentlich 
gewtinschten Teststarke von 1 — (3 = 0,95 entdecken? 

Einige Ergebnisse fiir den t-Test sind in der Tabelle 15.12 zusammengestellt. 

Tabelle 15.12: Teststarken 1 - (3 und zu entdeckende EffektgroBen 8 beim t-Test 

(a = 0,05, einseitig) 810 



n i = n 2 


1-P 

bei 8 a = 0,50 


8 entdeckbar 
mit 1 - (3 = 0,95 


10 


0,29 


1,53 


20 


0,46 


1,05 


30 


0,61 


0,86 


40 


0,72 


0,74 


50 


0,80 


0,66 


60 


0,86 


0,60 


70 


0,90 


0,56 


80 


0,93 


0,52 


90 


0,96 


0,49 



0 Konnen wir statt der notwendigen 87 Personen pro Gruppe nur 20 Personen realisieren, 
betragt die Teststarke fiir den interessierenden mittleren Effekt (5 a = 0,50) nach Tabelle 
15.12 nur noch 0,46. Eine Teststarke von 0,95 hat der Test bei dieser Fallzahl dann, wenn 
der tatsachliche Effekt sehr groB ist (8 = 1,05). Angesichts dieser unbefriedigenden Werte 
ist zu priifen, ob die Fallzahl nicht doch zumindest verdoppelt werden kann. 

Ftihrt man den Signifikanztest unter nicht-optimalen Bedingungen durch, lauft man 
also vor allem Gefahr, dass der Test insignifikant bleibt, obwohl tatsachlich ein 
relativ groBer Effekt vorliegt. Dies muss bei der Entscheidung iiber die empirische 
Hypothese unbedingt berlicksichtigt werden (siehe unten Kapitel 17). 



15.6 Erhohung der Prazision 

Priifen wir eine empirische Flypothese, ist die Prazision dieser Priifung, ceteris 
paribus, um so hoher, je geringer die Varianz innerhalb der Untersuchungs- 
bedingungen (oder Bedingungskombinationen) ist. Diese iiber alle Bedingungen 



809 Die Zahl der tatsachlich untersuchten Falle kann erheblich unter der maximal notwen- 
digen liegen, wenn man nur solange neue Falle in die Untersuchung einbezieht, bis die 
Ergebnisse nach den vorher festgelegten Kriterien eindeutig fiir die Akzeptierung der Ho 
oder der 1 1 1 sprechen (sequentiellelles Testen, Diepgen, 1996; Wald, 1966). 

810 Die Werte von 1-|3 in Abhangigkeit von N sind ein Teil der Operationscharakteristik 
des Tests auf diesem a-Niveau (Werte mit GPOWER und SamplePower ermittelt). 
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zusammengefasste Varianz der abhangigen Variablen innerhalb der Gruppen wird 
als unsystematische Varianz, Fehlervarianz oder Binnenvarianz bezeichnet. Sie 
kommt durch alle moglichen systematischen und zufalligen Unterschiede zustande, 
die zwischen den Personen und den Durchfiihrungen bestehen und die nicht explizit 
kontrolliert oder erfasst worden sind. 

Bei Varianzanalysen wird die Binnenvarianz durch die mittlere Fehlerquadrat- 
summe ausgedrlickt, die den Nenner der empirischen F-Werte, z.B. (15-38), 
bilden. 811 Bei nur zwei Gruppen ist sie Equivalent zur zusammengefassten Varianz 
Sp , die in (15-11) definiert wurde und im Nenner des t-Wertes (15-13) steht. 

Da die Binnenvarianzen im Nenner stehen, werden die Teststatistiken unter sonst 
gleichen Bedingungen um so groBer, je kleiner diese Varianzen sind. Bevor wir auf 
praktische Moglichkeiten zur Varianzreduktion eingehen, sollen zunachst die 
Auswirkungen einer kleineren Binnenvarianz auf Signifikanzentscheidung und 
Teststarke erlautert werden. 12 

15.6.1 Prazision und Teststarke 

Die Wirkung der Binnenvarianz auf die Teststarke hangt davon ab, in welcher 
MaBeinheit wir die angenommene EffektgroBe ausdrticken, die (wahrend die 
Binnenvarianz variiert wird) konstant bleiben soli. 

Eine kleinere Binnenvarianz fiihrt nicht zu einer groBeren Teststarke, wenn die 
angenommene EffektgroBe durch MaBe wie 5 (15-42) oder f 2 (15-28) ausgedrlickt 
wird, die eine Mittelwertsabweichung auf genau diese Binnenvarianz (oder eine 
Funktion von ihr) relativieren. 

Driicken wir die angenommene EffektgroBe als unrelativierte Mittelwerts- 
abweichung (z.B. (ij -p 2 , QS a oder MQS A ) aus, wird die Teststarke um so groBer, 
je kleiner die Binnenvarianz ist. Die Chance, eine konstante absolute Mittelwerts- 
differenz (z.B. 5 Punkte in einem bestimmten Test) als signifikant zu entdecken, ist 
also um so hoher, je geringer die Varianz der abhangigen Variablen in den Unter- 
suchungsgruppen ist. 

0 In unserem Dissonanzexperiment mit nj =n 2 =35 Personen waren die Varianzen in den 
beiden Experimentalgruppen sf = 17 und S2=15. Die gemittelte Schatzung fur die 
Populationsvarianz ergab Sp = 16 , die Schatzung fur den Standardfehler s y y = 0,956. 



Diese mittlere Fehler-Quadratsumme wird z.B. als MQSpehien MSE, MS errr or oder 6p ehler 
bezeichet. In SPSS-Ausdriicken ist sie in der Spalte “Mittel der Quadrate” in der Zeile 
“Fehler” oder “innerhalb der Gruppen” zu finden. Die entsprechenden Fehlervarianzen 
in der Population werden z.B. als cf bezeichnet. 

812 Allgemein ist die Prazision die Genauigkeit jeder Parameterschatzung. Sie wird durch 
die Breite des Konfidenzintervalls ausgedrlickt. Die Prazision eines Experiments kann 
auch iiber den Standardfehler in der verwendeten Teststatistik definiert werden (beim t- 
Test Sy y . Sie wird dann auch umso groBer, je groBer die Fallzahl ist (Hager, 1987, S. 
186-188; Hager & Westermann, 1983a, S. 127-128; McClelland, 1997). 
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Um die Auswirkungen einer Varianzreduktion zu illustrieren, nehmen wir nun an, die 
Varianzen in den Gruppen wlirden nur s^ =10 und s 2 =8 betragen. Die Schatzung fur 
die gemeinsame Populationsvarianz betragt dann s p = 9 , der Standardfehler s y| _ y2 = 
0,717. Verwenden wir die Normalverteilungsapproximation, liegt der kritische Wert der 
Teststatistik z unverandert bei 1,645, da er stets auf die Standardnormalverteilung 
bezogen ist und nur vom gewahlten a abhangt. Durch die Verringerung des Standard- 
fehlers wird allerdings die kritische Mittelwertsdifferenz unter der Nullhypothesen- 
verteilung kleiner. Sie betragt nach (15-44) statt 1,573 nur noch 1,18. 

Nehmen wir als erstes an, dass die EffektgroBe in dem Sinne konstant ist, dass die 
absolute Mittelwertsdifferenz von p 2 - fb = 2 unverandert bleibt. Dann erhalten wir fur 
die neue kritische Mittelwertsdifferenz 1,18 und fur den auf 0,717 reduzierten Standard- 
fehler statt des ursprunglichen Wertes von z = -0,447 den folgenden z-Wert: 

(15-49) z = 1,180-2 = _ U44 

0,717 

Diesem extremeren z-Wert, d.h. diesem groBeren Abstand der kritischen von der 
angenommenen Mittelwertsdifferenz entspricht eine Flache unter der Normal verteilung 
von etwa 0,13, d.h. eine erhohte Teststarke von etwa 0,87 (statt 0,67). 

Nehmen wir als zweites eine konstante relative EffektgroBe von S a = 0,5 an. Bei einer 
Standardabweichung von s p = 3 (statt urspriinglich s p = 4) entspricht dem nur noch eine 
angenommene absolute Mittelwertsdifferenz von P 2 ~~ Ml = 1,5 (statt urspriinglich P 2 _ Pi 
= 2). Die kritische Mittelwertsdifferenz von 1,18 hat unter dieser spezifischen 
Alternativhypothese S a = 0,5 den folgenden z-Wert: 

_ 1,180-1,5 

(15-50) z = = -0,446 . 

0,717 

Wir erhalten damit praktisch den gleichen z-Wert wie in Gleichung (15-45) oben. Daraus 
ergeben sich auch die gleichen Werte (3 = 0,33 und 1 — (3 = 0,67. Eine Reduzierung der 
Varianz flihrt hier also zu keiner Veranderung der Teststarke, weil die Reduktion auch in 
die konstante relative EffektgroBe S a eingeht. 

15.6.2 Methoden zur Varianzreduktion 

Die Werte der abhangigen Variablen werden innerhalb jeder Behandlungsgruppe an 
verschiedenen Personen sowie in der Regel auch zu verschiedenen Zeiten und unter 
(geringfligig) verschiedenen Umstanden erhoben. 

0 In jeder psychologischen Untersuchung unterscheiden sich die Personen in ihren stabilen 
Merkmalen (Fahigkeiten, Einstellungen, Motive usw.) und in ihren momentanen 
Zustanden (Aufmerksamkeit, Stimmung, Motivation usw.). AuBerdem gibt es Unter- 
schiede zwischen den situationalen Umstanden, unter denen die Personen untersucht 
wurden (Tageszeit, Versuchsleiterverhalten, Larmstorungen usw.). 

Ein Merkmal, in dem sich die Untersuchungspersonen oder die Untersuchungs- 
gelegenheiten unterscheiden, kann die Varianz der AV in den Bedingungen erhohen 
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und damit die Prazision der Hypothesenprufung verringern, wenn es mit der 
abhangigen Variable assoziiert ist. 13 

Deshalb kann die Prazision durch alle MaBnahmen erhoht werden, die 
Unterschiede zwischen Untersuchungspersonen und -gelegenheiten oder ihre 
Assoziationen zur AV verringern. Insbesondere kann man Variablen, die vermutlich 
stark mit der AV assoziiert sind, konstanthalten oder eliminieren, man kann sie als 
Kontrollfaktor in den Versuchsplan einfiihren und man kann sie als Kovariate 
erheben und statistisch auspartialisieren. 14 

Konstanthaltung und Elimination 

Die Konstanthaltung und Elimination von personalen oder situationalen Merkmalen 
haben wir schon als Vorgehensweise zur Erhohung der internen Validitat eines 
Experiments kennen gelernt (siehe Kapitel 14.2). Durch Konstanthaltung und 
Elimination von Faktoren, die mit der AV assoziiert sind, wird aber auch die Varianz 
der AV in den Bedingungen reduziert. Die Prazision kann deshalb erhoht werden, 

• wenn man mit der AV assoziierte Personlichkeitseigenschaften (z.B. Alter oder 
Bildungsstand) konstanthalt (z.B. indem man nur Zwanzigjahrige oder nur 
Hauptschulabsolventen untersucht) oder 

• wenn man mit der AV assoziierte Situationsbedingungen (z.B. Eigenschaften des 
Versuchsleiters oder Wortlaut der Instruktion) konstanthalt (z.B. indem man stets 
den gleichen Versuchsleiter oder schriftliche Instruktionen verwendet) oder 

• indem man mit der AV assoziierte Situationsbedingungen (z.B. Storungen durch 
StraBenverkehr) ganz ausschaltet (z.B. indem man die Untersuchung in einem 
schallgeschiitzten Raum durchfiihrt). 

Den entscheidenden Nachteil der Konstanthaltung und Elimination hatten wir bereits 
kennen gelernt: Die betrachtete Situation wird spezifischer, d.h. die Gultigkeit der 
wissenschaftlichen Hypothese wird nur noch fur einen eingeschrankten Bereich 
gepriift, z.B. nur noch fur Zwanzigjahrige in schallisolierten Raumen. 

Einfiihrung von Kontrollfaktoren 

Wenn eine bestimmte Variable vermutlich stark mit der AV assoziiert ist, es aber 
nicht sinnvoll ist, sie konstant zu halten, kann die drohende Verminderung der 
Prazision verhindert werden, indem man diese Variable explizit als Faktor in den 
Versuchsplan einflihrt. 

0 Im Kapitel 14.4 hatten wir im Experiment mit den beiden Bedingungen niedrige und hohe 
Belohnung (Aj und A 2 ) zur Kontrolle der internen Validitat den Untersuchungsort nicht 



813 Ist diese Variable auBerdem mit der unabhangigen Variablen assoziiert, ist sie auch eine 
Storvariable, die die interne Validitat verringert (siehe oben Kapitel 14.1.2). 

814 ausfuhrlicher: Hager (1987, S. 188-213) 
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frei variieren lassen, sondern ihn als Kontrollfaktor mit zwei Auspragungen (Luxushotel 
vs. Institutskeller, B | und B 2 ) eingefuhrt (siehe oben Seite 318f.). 

Bei der Datenauswertung fiihrt ein Ubergang von einem Zweigruppen-t-Test zu einer 
zweifaktoriellen Varianzanalyse (in der Regel) zu einer erhohten Prazision des 
statistischen Mittelwertsvergleichs zwischen A! und A 2 . Der Standardfehler des t- 
Tests ist durch die Varianz in den beiden Gruppen bestimmt, der Standardfehler des 
varianzanalytischen F-Tests beruht hingegen auf der Varianz der abhangigen 
Variablen in den vier Bedingungskombinationen. Diese neue Binnenvarianz ist 
kleiner als die alte, falls der Faktor B tatsachlich eine substanzielle Assoziation mit 
der AV hat. 815 

Parallelisierung 

Ein Kontrollfaktor kann sich nicht nur auf eine situationale Variable beziehen, die 
gezielt manipuliert und deshalb als experimenteller Faktor eingefuhrt werden kann. 
Man kann vielmehr auch eine Personeneigenschaft als zusatzlichen Faktor einfiihren, 
um die interne Validitat und die Prazision zu erhohen. In diesem Fall spricht man 
von einer Blockbildung ( randomized blocks design ) bzw. einer Parallelisierung , 816 

0 Wollen wir neben dem experimentellen Faktor A mit seinen zwei Auspragungen das 
Alter der Personen als einen Kontrollfaktor einfiihren, miissen die Personen zunachst 
nach ihrem Alter geordnet werden. AnschlieBend werden sie der Reihe nach in Paare 
aufgeteilt. Innerhalb jedes Paares mit relativ gleichem Alter werden die Personen zufallig 
auf die experimentellen Behandlungsbedingungen aufgeteilt. Die Varianz der AV wird 
um so starker reduziert, je mehr sich die AV zwischen den Altersgruppen unterscheidet 
(d.h. je groBer die Assoziation zwischen der AV und der Kontrollvariablen ist). 

Als Spezialfall der Parallelisierung kann man die Beobachtung aller Personen unter 
alien Bedingungen betrachten. Diese wiederholte Messung fiihrt in der Regel zu 
einer ganz erheblichen Erhohung der Prazision, sehr leicht jedoch auch zu 
zusatzlichen Storungen der internen Validitat (siehe Kapitel 14.1). Bei mehr als zwei 
experimentellen Gruppen erfordern die statistischen Tests fur wiederholte 
Messungen dariiber hinaus zusatzliche Annahmen, die nicht immer problemlos 

017 

erfullt werden konnen. 

Kovarianzanalyse 

Um die Prazision zu erhohen, muss man Variablen nicht unbedingt in Kategorien 
einteilen und als unabhangige Variablen im Sinne der Varianzanalyse behandeln. 
Man kann die Werte der Personen auf diesen Variablen auch in ihrer urspriinglichen 
Form belassen und die Variablen als Kovariaten in eine Kovarianzanalyse 



Demonstrationen: Bortz (1999, S. 280-287), Hager (1987, S. 190-195) 

816 siehe oben Seite 318 

817 siehe oben FuBnote 626, Seite 277 
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einfuhren . 818 Bei einer Kovarianzanalyse werden zunachst die Kovariaten durch eine 
lineare Regression aus den Werten der abhangigen Variablen auspartialisiert, bevor 
die eigentlich interessierende Mittelwertsvergleiche durch eine Varianzanalyse 
erfolgen. Wenn die Beziehung zwischen der Kovariaten und der AV linear ist, wird 
die Prazision dadurch starker als durch einen Kontrollfaktor erhoht. Dieser kann 
dagegen die Prazision auch dann erhohen, wenn z.B. eine U-formige Beziehung 
besteht. Die Kovarianzanalyse hat wiederum den Vorteil, dass die Auspragungen der 
Kovariaten zwar vor dem Experiment erhoben, aber nicht bei der Durchfuhrung des 
Experiments beriicksichtigt werden miissen. 

Besonders deutlich kann die Prazision erhoht werden, wenn die Auspragung der 
abhangigen Variablen bereits vor der experimentellen Behandlung erhoben worden 
ist. Diese Vortestmessung ( pretest ) kann als Kovariate verwendet werden, man kann 
aber auch einfach die Differenz zwischen Vor- und Nachtestwerten als abhangige 
Variable verwenden . 819 



Bortz (1999, Kapitel 10), Keppel (1991, Kapitel 14). In SPSS konnen im Allgemeinen 
linearen Modell Kovariaten eingegeben werden. 

zur statistischen Analyse von Veranderungswerten: Cronbach & Furby (1970), Cook & 
Campbell (1979, Kap. 4), Krauth (1983), Tack (1986), Bryk & Raudenbush (1987), 
Francis et al. (1991), Collins & Horn (1991), Renkl & Gruber (1995) 





16 Hypothesenvaliditat 



Im vorangegangenen Kapitel haben wir diejenigen Aspekte der statistischen Validitat 
betrachtet, die unmittelbar davon abhangen, wie statistische Tests angewendet 
werden. Die Prtifung statistischer Hypothesen ist aber kein Selbstzweck, sondern 
dient der Beantwortung inhaltlicher Fragestellungen und der Prlifung substanz- 
wissenschaftlicher Hypothesen. In diesem Kapitel werden die Teilaspekte der 
statistischen Validitat besprochen, die mit den Beziehungen zwischen den 
statistischen und den psychologischen Hypothesen zusammenhangen. Sie werden 
unter dem Begriff der Hypothesenvaliditat zusammengefasst. Im Kapitel 16.1 
werden die Hin- und Rlickwege von den psychologischen Hypothesen einerseits zu 
den statistischen Ergebnissen andererseits zusammengefasst. AnschlieBend werden 
die moglichen Storungen der Hypothesenvaliditat fur verschiedene Arten von 
empirischen Vorhersagen dargestellt: tiber die Ordnung von zwei Mittelwerten 
(Kapitel 16.2), die Gleichheit von Mittelwerten (Kapitel 16.3), Ordnungen mehrerer 
Mittelwerte (Kapitel 16.4) und die Interaktion zwischen Variablen (Kapitel 16.5). 



16.1 Psychologische Hypothesen und statistische Ergebnisse 

Signifikanztests priifen jeweils bestimmte statistische Hypothesen, das heiBt 
Aussagen liber die Verteilungen oder Parameter (Populationstest, siehe Kapitel 15.2) 
bzw. Aussagen liber die Gleichwahrscheinlichkeit von Datenaufteilungen (Permu- 
tationstest, siehe Kapitel 15.3). Diese statistischen Hypothesen sind fur die 
psychologische Wissenschaft nur selten von direktem Interesse. Die Priifung von 
statistischen Hypothesen ist nur ein Hilfsmittel, um psychologische Forschungs- 
fragestellungen zu beantworten, d.h. um psychologische Theorien und Hypothesen 
zu tiberpriifen, um psychologische Sachverhalte zu erklaren usf. 

Statistische und psychologische Hypothesen sind demnach nicht gleichbedeutend 
und nicht gleichwertig, sondern liegen auf unterschiedlichen konzeptuellen Ebenen. 
Das Ergebnis von statistischen Auswertungen kann nur dann hilfreich fiir die richtige 
Beantwortung psychologischer Fragestellungen sein, wenn eine systematische 
Verbindung zwischen statistischer und psychologisch-inhaltlicher Ebene besteht. 
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Aus falsifikationstheoretischer Sicht ist es wiinschenswert, dass die Giiltigkeit 
einer psychologischen Hypothese eindeutig die Giiltigkeit einer statistischen 
Hypothese impliziert: PH — » SH. Aus der Falschheit der statistischen kann dann 
auf die Falschheit der psychologischen Hypothese geschlossen werden ( modus 
tollens). 

Die Beziehung zwischen psychologischen und statistischen Hypothesen wird 
durch eine logische Implikation aber nur unvollkommen und idealisiert beschrieben. 

• Die Annahme einer Implikationsbeziehung zwischen PH und SH ist unvoll- 
kommen, denn man kann zwar bei Falschheit der Konklusion SH auf die Falsch- 
heit der Pramisse PH schlieBen, es gibt aber keine logischen Konsequenzen fur 
den Fall, dass die SH akzeptiert wird. 

• Die Annahme einer Implikation beruht auf der Voraussetzung, dass psycholo- 
gische und statistische Hypothese jeweils entweder wahr oder falsch sind. 
Tatsachlich sind keine zwingenden Schliisse auf die Falschheit der psychologi- 
schen Hypothese moglich, weil wir gar nicht eindeutig feststellen konnen, ob eine 
statistische Hypothese falsch ist. Wir konnen uns nur entscheiden, sie aufgrund 
der empirischen Ergebnisse als unzutreffend abzulehnen. 

• Die Annahme einer Implikation ist eine starke Idealisierung, weil stets Zusatz- 
annahmen notwendig sind, damit statistische Hypothesen zwingend aus 
psychologischen Hypothesen folgen. Vor allem muss angenommen werden, dass 
die interne Validitat nicht gestort ist. 821 Ist Z die Konjunktion aller notwendigen 
Zusatzannahmen, gilt damit PH a Z — > SH. Aus der Falschheit von SH kann dann 
nicht mehr eindeutig auf die Falschheit von PH geschlossen werden. Auch eine 
oder mehrere Zusatzannahmen konnen falsch sein. 2 

Verbindung iiber mehrere Ebenen 

Zwischen psychologischen und statistischen Hypothesen besteht demnach keine 
Implikationsbeziehung, sondern allenfalls eine Ableitungsbeziehung in einem relativ 
lockeren Sinn. 823 Im Folgenden wollen wir diese Verbindung zwischen psychologi- 
schen und statistischen Hypothesen aus strukturalistischer Sicht etwas genauer be- 
schreiben, indem wir die dazwischen liegenden Ebenen der empirischen Hypothesen 
und der empirischen Vorhersagen beriicksichtigen. 824 Skizziert sind diese 
Zusammenhange in der Abbildung 16.1, die eine Erweiterung der Abbildung 11.6 
von Seite 254 ist und im folgenden nach und nach erlautert wird. 



820 

821 

822 

823 

824 



Bredenkamp (1972, 1980, 1996), Erdfelder & Bredenkamp (1994), Hager & 
Westermann (1983a), Chow (1996) 

Randomisierung ist deshalb Voraussetzung fur eine implikative Beziehung zwischen 
psychologischen und statistischen Hypothesen (Erdfelder & Bredenkamp, 1994). 
siehe die Argumentation oben im Kapitel 9.2.2 
Meehl (1967, S. 104) 

ahnliche Stufenschemata: Hager (1992a), Chow (1996, 1998) 
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Abbildung 16.1: Verbindungen zwischen empirischen und statistischen Hypothesen 

1. Substanzwissenschaftliche Hypothesen im Allgemeinen und psychologische 
Hypothesen im Besonderen sind alle Arten von impliziten oder expliziten 
Aussagen darliber, dass bestimmte Theorien, Modellvorstellungen, Kausal- 
zusammenhange und Merkmalsassoziationen zutreffend sind. Jede substanz- 
wissenschaftliche Hypothese entspricht der empirischen Behauptung, dass ein 
bestimmtes Theorie-Element oder Theorie-Netz fur alle intendierten Anwen- 
dungen Geltung besitzt. Psychologische Kausalhypothesen sollen streng 
genommen fur jedes einzelne Individuum in ihrem Anwendungsbereich gelten 
und werden meist probabilistisch interpretiert. Assoziationshypothesen konnen 
sich auch auf Individuengruppen beziehen. 825 

0 Mit der Dissonanztheorie verbunden ist unter anderem die psychologische Hypothese, 
dass der Meinungsunterschied nach einem freiwilligen und offentlichen einstellungs- 
kontraren Verhalten um so kleiner ist, je kleiner die Belohnung dafiir war. 



825 



siehe dazu oben die Kapitel 7.1.5 und 7.2.7 
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2. In einer bestimmten psychologischen Untersuchung kann die empirische 
Hypothese (EH) geprtift werden, dass eine bestimmte psychologische Hypothese 
(PH) fur die betrachteten Personen und Umstande zutreffend ist. Es wird damit 
untersucht, ob die betrachteten Phanomene durch die betreffende theoretische 
Struktur beschrieben und erklart werden konnen. Wenn die untersuchte Situation 
zur Menge der intendierten Anwendungen gehort, ist der Gehalt der empirischen 
Hypothese im Gehalt der empirischen Behauptung enthalten, so dass zwischen 
dieser allgemeineren psychologischen Hypothese und der fallspezifischen 
empirischen Hypothese eine logische Implikationsbeziehung besteht: PH — » EH. 

0 Frey und Irle priifen die Giiltigkeit ihrer dissonanztheoretischen Hypothese fur eine 
bestimmte intendierte Anwendungssituation: Sie untersuchen, ob Gymnasiasten, die 
freiwillig und offentlich einen Aufsatz gegen die Senkung des Wahlalters schreiben 
(Bedingung EO+), ihre Meinung zu dieser Senkung starker anderten, wenn sie 1 DM 
statt 8 DM Belohnung bekamen. 

3. Aus einer empirischen Hypothese EH kann fur die konkret betrachteten 
Bedingungen und Variablen mindestens eine empirische Vorhersage (EV) liber 
beobachtbare Ergebnisse gewonnen werden. (Diese Beziehung wird gleich noch 
genauer betrachtet.) Dabei muss vorausgesetzt werden, dass alle anderen 
moglichen Einflussvariablen kontrolliert sind. Da sich Storvariablen der internen 
Validitat in der Regel nur hinreichend kontrollieren lassen, wenn jeweils mehrere 
Untersuchungseinheiten den Bedingungen zufallig zugewiesen werden, beziehen 
sich empirische Vorhersagen meist nicht mehr auf einzelne Individuen, sondern 
auf Merkmale ganzer Untersuchungsgruppen. 

0 Im Experiment von Frey und Irle wird aus der empirischen Hypothese fur die 
Bedingung EO+ die Vorhersage abgeleitet, dass die Einstellungen in der Gruppe mit 1 
DM im Mittel weniger positiv sind als in der Gruppe mit 8 DM Belohnung: y n < y 12 . 
Fur die Bedingung EO- ergibt sich die umgekehrte Vorhersage: y 21 > y 22 . 

4. Um zu priifen, ob die empirische Vorhersage fur die erhobenen Daten einge- 
troffen ist, reicht es im Prinzip aus, die entsprechenden deskriptiven Statistiken 
(z.B. arithmetische Mittelwerte) zu betrachten. In der Psychologie herrscht jedoch 
breiter Konsens, dass der Vergleich zwischen vorhergesagten und tatsachlichen 
Datenstrukturen auf Grund von statistischen Tests zu erfolgen hat. Die 
Signifikanztests sind Instrumente zur Entscheidung, ob vorhergesagte und 



826 

Wir betrachten also Gruppenergebnisse, um Theorien und Hypothesen, die sich auf 
Prozesse und Zusammenhange in einzelnen Individuen beziehen, in valider Weise 
empirisch uberpriifen zu konnen. Problematischer ist es, aus Gruppendaten Aussagen 
liber Individuelles abzuleiten. Unterschiede und Zusammenhange, die liber mehrere 
Personen hinweg auftreten, mlissen nicht auch bei einzelnen (oder gar alien) Personen 
bestehen (Asendorpf, 1995; Bredenkamp, 1972; Estes, 1956; Schmitz, 2000; Steyer & 
Schmitt, 1990). 
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tatsachliche Datenstrukturen systematisch oder zufallig miteinander iiberein- 

897 

stimmen oder voneinander abweichen. 

5. Weichen die empirischen Ergebnisse von den Vorhersagen ab und wird diese 
Abweichung aufgrund der Signifikanz (p-Wert und a-Niveau), der empirischen 
EffektgroBe (d) und der gegebenen Teststarke (l-(3) als systematisch bewertet, 
lehnt man die empirische Hypothese als unzutreffend ab und betrachtet die 
psychologische Hypothese als erschiittert, eingeschrankt giiltig, revisionsbediirftig 
oder dergleichen. Stimmen Vorhersagen und Ergebnisse iiberein oder werden 
eventuelle Abweichungen nur als unsystematisch bewertet, wird die empirische 
Hypothese als zutreffend akzeptiert und die psychologische Hypothese als 
empirisch gestiitzt interpretiert. Dabei muss stets vorausgesetzt werden, dass die 
Validitat der Untersuchung (die Strenge bzw. das Wohlwollen) ausreichend hoch 
war. 

0 Im Experiment von Frey und Irle war wie vorhergesagt y 12 = 2,56 groBer als y n = 
0,06. Da dieser Mittelwertsunterschied signifikant war, wurde die Ubereinstimmung 
zwischen der erwarteten und der tatsachlichen Ordnung der Mittelwerte als systema- 
tisch interpretiert. 

Empirische Hypothesen und Vorhersagen 

Empirische Hypothesen in der Psychologie fiihren sehr haufig zu der ganz 

allgemeinen Erwartung, dass die interessierenden Werte in der einen Bedingung 

grofier sind als unter der anderen. Dies symbolisiert man mitunter einfach durch die 

erwartete Rangordnung zwischen den Untersuchungsbedingungen oder -gruppen. 

_ • • 

0 In der Dissonanzbedingung EO+ wird “A 2 > A | " erwartet, in einer Untersuchung zur 
Sprachbegabung beispielsweise “Manner < Frauen”. 

Nach den Erfahrungen in alien Bereichen der Psychologie gibt es praktisch keine 

empirischen Untersuchungsergebnisse, bei denen alle Werte in der einen Gruppe 

groBer sind als alle Werte in der anderen. Vielmehr uberlappen sich die Verteilungen 

der interessierenden AV in den Gruppen in aller Regel erheblich. Deshalb konnen 

aus der empirischen Hypothese nur schwachere Vorhersagen abgeleitet werden. 
• • 

Ublicherweise werden in der Psychologie arithmetische Mittelwerte betrachtet und 
empirische Vorhersagen wie y 2 > y t getatigt. Daneben sind auch noch andere Arten 
von empirischen Vorhersagen moglich. 

• Man kann vorhersagen, dass die abhangige Variable Y in A 2 empirisch grofier ist 
als in Ai: Fur alle auftretenden Werte von Y sollen die kumulierten relativen 
Haufigkeiten oder Prozentsatze in A, geringer sein als in A 2 . 828 

827 

vgl. oben Kapitel 15.3 und insbesondere 15.3.6 

828 ^ A 

zu kumulierten Haufigkeitsverteilungen: Hays (1994, Kap. 2.12). In SPSS werden im 
Menu Haufigkeiten (Syntax: FREQUENCIES) kumulierte Prozentsatze berechnet. Die 
Relation empirisch grofier fur relative Haufigkeiten entspricht der Relation stochastisch 
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• Eine schwachere Vorhersage besteht darin, dass der Median in A 2 der groBere 
sein soil: Md 2 > Mdi. 

• In ahnlicher Weise kann man vorhersagen, dass der durchschnittliche Rangplatz 
der Werte aus A 2 hoher ist oder dass die Werte aus A 2 im Paarvergleich 
tendenziell grofier sind. 

Wenn die Verteilungen in beiden Bedingungen symmetrisch sind und die gleiche 
Form haben (z.B. ausreichend der Normal verteilung angenahert sind), sind diese 
empirischen Vorhersagen Equivalent mit der Mittelwertsvorhersage y 2 >y 1 . 
Systematische Abweichungen treten jedoch auf, wenn die Verteilungen unter- 
schiedlich schief sind oder wenn einige Werte sich sehr deutlich von den anderen 
unterscheiden (“AusreiBer”). 

0 In einer Untersuchung seien die Werte der AV Y in der Bedingung Ai gleich 2, 4, 10, 12 
und 14, in A 2 gleich 4, 6, 8, 14 und 16. Es ist y) = 8,4, y 2 = 9,6 und damit vorhersage- 
gemaB y 2 > y) . Der Wert der entsprechenden t-Statistik wird wegen der extrem kleinen 
Fallzahl allerdings nicht signifikant. VorhersagegemaB sind auch die GroBenordnungen in 
den 25 moglichen Paaren von Beobachtungen aus beiden Gruppen: In 14 von ihnen ist 
der Wert aus A 2 groBer als der aus A i . Da die empirischen Rangsummen T 2 = 30 und I) 
= 25 sind, weisen auch die nicht-parametrischen Rangtests nach Mann- Whitney und 
Wilcoxon (siehe oben Kapitel 15.3.3) in die gleiche Richtung. Vorhersagekontrar sind 
dagegen die Mediane: Md 2 = 8 < Md|= 10. Die divergierenden GroBenrelationen bei 
arithmetischen Mittelwerten und Medianen zeigt, dass die Verteilungen unterschiedlich 
schief sind. Deshalb ist A 2 auch nicht durchgangig empirisch groBer als Ap Vorhersage- 
gemaB sind beispielsweise 20% der Werte in A 2 nicht groBer als 4, dagegen 40% der 
Werte in A| . Nicht groBer als 9 sind 60% der Werte in A 2 , entgegen der Vorhersage aber 
nur 40% der Werte aus Aj. 

Trotz der moglichen Divergenzen werden empirische Vorhersagen kaum jemals 
tiberlegt gewahlt, sondem meist implizit dadurch, dass allgemein tibliche Tests 
angewendet werden, die bestimmte Hypothesen tiberprtifen. 

Wenn wir davon sprechen, dass Vorhersagen tiber empirische Beobachtungen von 
psychologischen oder empirischen Hypothesen abgeleitet, deduziert oder impliziert 
werden, ist das nur in einem approximativen Sinn gemeint. Empirische Vorhersagen 
ergeben sich aus den empirischen Hypothesen nur dann logisch zwingend, wenn 
zusatzlich angenommen wird, dass das Experiment ausreichend valide ist. Vor allem 
mtissen Variablenvaliditdt (Kapitel 13.5) und interne Validitat (Kapitel 14) 
ausreichend hoch sein. Die theoretischen Variablen mtissen also adaquat 
operationalisiert sein und alle moglichen anderen Einflussvariablen mtissen 

grofier zwischen zwei Zufallsvariablen Yj und Y 2 mit den Verteilung sfunktionen F| und 
F 2 : Y 2 > Yj gdw Vy e P: F 2 (y) < Fj(y) a 3y e P: F 2 (y) < Fj(y) (nach Rasch, 1976, S. 
234). 

829 siehe oben Seite 344 

830 Dies demonstriert, dass die Rangtests keineswegs, wie haufig (in erster Annaherung) 
gesagt wird, Hypothesen liber Mediane priifen (siehe oben Kapitel 15.3.3). 
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hinreichend kontrolliert sein. Eine empirische Vorhersage EV ist dann optimal fur 
die Prlifung einer empirischen Hypothese EH geeignet, wenn sie aus EH und der 
Validitatsannahme V deduktiv-logisch ableitbar ist: EH a V-) EV (vgl. Abbildung 
16.1). 

Besonders wichtig fur die Ableitbarkeit von Vorhersagen ist die interne Validitat. 

0 Hatten Frey und Irle in der Dissonanzbedingung EO+ mit 1 DM Belohnung iiberwiegend 
Schuler untersucht, die sehr stark auf ihrer Meinung beharren, unter der 8 DM-Bedingung 
dagegen sehr anpassungsbereite Schuler, ware trotz Giiltigkeit der Dissonanztheorie nicht 
unbedingt y n < y 12 zuerwarten. 

Ein fur empirische Vorhersagen sehr wichtiger Aspekt der Variablenvaliditat ist das 
Skalenniveau der abhangigen Variablen. Empirische Vorhersagen liber die 
GroBenordnung von arithmetischen Mittelwerten sind nur dann sinnvoll, wenn die 
Variable mindestens Intervallskalenniveau hat, das heiBt wenn sie nicht beliebigen 

Oil 

monotonen, sondern nur linearen Transformationen unterzogen werden kann. 
Empirische Vorhersagen liber Mediane und paarweise GroBenordnungen sind 
dagegen auch schon sinnvoll, wenn die Variable Ordinalskalenniveau hat, also 
monoton transformiert werden kann. 

9 Hatten Frey und Irle die Einstellung zur Senkung des Wahlalters nicht auf einer 
graphischen Skala erhoben, sondern, wie es sehr iiblich ist, mit einer Ratingskala, deren 
Antwortkategorien ausschlieBlich verbal charakterisiert sind, ware es viel unsicherer, ob 
die Kategorien subjektiv gleichabstandig sind und die resultierenden Werte tatsachlich 
Intervallskalenniveau haben. Durch erlaubte monotone Transformationen dieser Werte 
konnte dann eine zur Vorhersage (12-1) konforme Mittelwertsrelation y n < y 12 vorher- 
sagekontrar werden (y n > y 12 ). 

Definition der Hypothesenvaliditat 

Wie wir gesehen haben, werden psychologische und empirische Hypothesen in der 
Regel nur dann als bewahrt oder bestatigt angesehen, wenn das empirische Ergebnis 
nicht nur der empirischen Vorhersage entspricht, sondern auch “iiberzufallig” ist. 
Um dies festzustellen, werden Signifikanztests durchgefiihrt, also bestimmte 
statistische Hypothesen gepriift. Diese Tests miissen so gewahlt werden, dass die 
moglichen Entscheidungen liber die gepriiften statistischen Hypothesen eindeutig 
und sinnvoll auf Entscheidungen liber die interessierende empirische Hypothese 
abzubilden sind. Diesen Aspekt der Validitat einer Untersuchung bezeichnen wir als 
Hypothesenvaliditat. 832 



831 

832 



siehe oben FuBnote 734, Seite 346 

entspricht im Prinzip der Ableitungsvaliditdt bei Hager (1984, 1992a, 1992b) 
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• Die Hypothesenvaliditat ist gegeben, wenn empirische Vorhersage und 
statistische Hypothesen homomorph (strukturgleich) sind. 833 

Im einfachsten Fall kann die empirische Vorhersage homomorph mit der Null- oder 
der Alternativhypothese eines einzigen Tests sein: 

- Die Parameterkonstellationen, die unter eine der statistischen Hypothese fallen, 
entsprechen genau den Konstellationen von Statistiken, die die empirische 
Vorhersage bestatigen. 

- Die Parameterkonstellationen, die unter die andere statistische Hypothese fallen, 
entsprechen genau den empirischen Ergebnissen, die der empirischen Vorhersage 
widersprechen. 

Wenn die moglichen Ergebnisse der statistischen Hypothesenprufung nicht eindeutig 
den moglichen Entscheidungen liber die empirische Hypothese zugeordnet werden 
konnen, ist die Hypothesenvaliditat gestort. In aller Regel wird dadurch die 
Wahrscheinlichkeit einer Fehlentscheidung fiber die empirische Hypothese erhoht, 
d.h. die Validitat der Untersuchung insgesamt wird verringert. 

Um naher zu erlautern, wie Storungen der Hypothesenvaliditat vermieden werden 
konnen, sollen in den folgenden Kapiteln 16.2 bis 16.5 einige typische Strukturen 
von empirischen Vorhersagen analysiert werden. Die ihnen zugeordneten statisti- 
schen Hypothesen entsprechen nur sehr einfachen statistischen Modellen zur 
Beschreibung der empirischen Daten. Die Ubertragung der Prinzipien auf andere 
Arten von empirischen Vorhersagen und statistischen Modellen ist jedoch problem- 
los moglich. 835 



g33 

Eine empirische Vorhersage, wie z.B. y 2 > y x besteht aus einer Menge S von 
moglichen Gruppenstatistiken, z.B. {y 1 ,y 2 }, und einer auf ihr definierten Relation R, 
z.B. >. Eine statistische Hypothese, z.B. besteht ebenfalls aus einer Menge El 

von moglichen Parametern pi und einer auf ihr definierten Relation R\ Kann ein 
Homomorphismus zwischen den Strukturen <S,R> und <n,R’> hergestellt werden, ist 
die Hypothesenvaliditat gegeben (zur homomorphen Abbildung von Strukturen siehe 
oben Kapitel 6.7) 

834 x 

Diese empirischen Vorhersagen und statistischen Modelle sind in der Regel aus- 
reichend, um interessierende psychologische Hypothesen empirisch zu priifen. Meist 
bleibt dabei allerdings eine relativ groBe Fehler- oder Binnenvarianz bestehen. Verfolgt 
man das Ziel, die gesamte Varianz moglichst vollstandig aufzuklaren, kann man weitere 
Variablen einflihren und umfangreichere statistische Modelle anpassen (zu Prtifung und 
Vergleich statistischer Modelle: Judd & McClelland, 1989; Judd et al., 1995). 

835 Hager & Westermann (1983a, 1983c), Westermann & Hager (1983a), Hager (1987, S. 
78-83, 161-171), besonders ausfuhrlich: Hager (1992b) 
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16.2 Vorhersagen tiber die Ordnung zweier Mittelwerte 

Wenn zwei Experimentalbedingungen oder Personengruppen A x und A 2 hinsichtlich 
einer abhangigen Variablen Y verglichen werden, lasst sich aus der empirischen 
Hypothese sehr haufig eine Vorhersage liber die Ordnung der beiden Mittelwerte 
ableiten, beispielsweise y 2 > y x . 836 

Die Hypothesenvaliditat ist in diesem Fall nicht gestort, wenn wir einen 
einseitigen t-Test anwenden, denn die empirische Vorhersage y 2 > y, und die 
gerichtete Alternativhypothese p 2 > p x sind strukturgleich. Zwischen ihnen kann ein 
Homomorphismus so hergestellt werden, dass Mittelwertskonstellationen, fur die die 
empirische Vorhersage gilt, eindeutig Parameterkonstellationen zugeordnet sind, die 
unter die H x fallen. Die Parameterkonstellationen unter der Nullhypothese 

konfligieren dagegen eindeutig mit der empirischen Vorhersage. 

Bei zwei Untersuchungsgruppen konnen wir eine Kodiervariable G fur die 
Gruppenzugehorigkeit definieren, so dass G fur Personen in A x den Wert 0 und fur 
Personen in A 2 den Wert 1 annimmt. 8 Eine empirische Vorhersage liber eine 
Mittelwertsordnung bezliglich der AV Y ist dann Equivalent einer empirischen 
Vorhersage liber eine Produkt-Moment-Korrelation: r(G,Y) > 0. Auch die 
Alternativhypothese p > 0 des t-Tests fur Korrelationskoeffizienten ist demnach 
strukturgleich mit einer empirischen Vorhersage der Form y 2 > y x . 

Anwendung zweiseitiger Tests 

Haufig werden bei gerichteten Mittelwertsvorhersagen zweiseitige t-Tests oder 
varianzanalytische F-Tests durchgefiihrt. Die Hypothesenvaliditat ist dann gestort. 
Zwischen der empirischen Vorhersage y 2 > y, und der Alternativhypothese p x ^ p 2 , 
gegen die bei diesen Tests geprtift wird, besteht keine Strukturgleichheit. Von den 
Parameterkonstellationen, die unter die H x fallen, konfligiert die eine Halfte (alle 
Falle mit p 2 < p, ) mit der empirischen Vorhersage, die andere Halfte aber nicht. Die 
Entscheidungen liber die statistischen Hypothesen konnen deshalb nicht eindeutig 
auf Entscheidungen liber die empirische Hypothesen tibertragen werden. 

0 Im Experiment von Frey und Irle lautet die empirische Vorhersage fur die Bedingung 
EO+ y, ! < y 12 (siehe Seite 286). Ausgewertet werden die Daten jedoch durch eine 
einfaktorielle Varianzanalyse. Der F-Test der Varianzanalyse priift in diesem Fall die 
Nullhypothese p X2 = p xx gegen die Alternativhypothese p X2 ^ p xx . 

Weder die Null- noch die Alternativhypothese sind homomorph zur empirischen 
Vorhersage. Die Nullhypothese umfasst eine Parameterkonstellation (namlich die 
Gleichheit der Mittelwerte), die gegen die empirische Vorhersage sprechen wiirde. Die 



836 

837 

838 



Die zur Ableitung der empirischen Vorhersage zusatzlich notwendige Validitats- 
annahme V bleibt im Folgenden der Einfachheit halber unberiicksichtigt. 

Dazu ordnet man jedem Mittelwert y ; einfach den Erwartungswert u = y x zu. 
siehe oben Tabelle 15.4 
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Nullhypothese umfasst aber nicht alle vorhersagekontraren Parameterkonstellationen. Die 
Alternativhypothese umfasst sowohl vorhersagekonforme wie vorhersagekontrare 
Parameterkonstellationen. Die Signifikanz des F-Tests und die Ablehnung der Null- 
zugunsten der Alternativhypothese spricht also nicht unbedingt fur die empirische 
Vorhersage und lasst damit keine eindeutige Bewertung der empirischen und wissen- 
schaftlichen Hypothesen zu. 

Wird bei einer gerichteten Mittelwertsvorhersage ein zweisei tiger t-Test oder ein F- 
Test durchgefiihrt, kann das Ergebnis trotzdem sinnvoll verwendet werden. Man 
muss lediglich darauf achten, dass ein signifikantes Ergebnis nur dann als 
Untersttitzung fur die empirische und psychologische Hypothese interpretiert wird, 
wenn die Mittelwertsunterschiede in der vorhergesagten Richtung liegen. Dadurch 
wird indirekt ein Homomorphismus zwischen statistischen Hypothesen und 
empirischen Vorhersagen hergestellt. Man arbeitet aber zwangslaufig (und meist 
unwissentlich) mit einem Signifikanzniveau, das um die Halfte reduziert ist. Die 
Priifung der empirischen Hypothese wird dadurch unbeabsichtigt strenger und 
weniger wohlwollend. 

Ausgleichen kann man diese mogliche Beeintrachtigung der Untersuchungs- 

validitat dadurch, dass man bei der Durchftihrung des Signifikanztests das eigentlich 

• • 

gewahlte Signifikanzniveau a verdoppelt oder die ermittelte Uberschreitungs- 
wahrscheinlichkeit p halbiert. 

0 Frey und Irle haben fur die Bedingung EO+ in der Varianzanalyse ein F = 4,32 erhalten 
(mit 1 Zahler- und 30 Nenner-Freiheitsgraden). Die zugehorige Uberschreitungswahr- 
scheinlichkeit ist p = 0,046. Bei a = 0,05 ist der Test damit signifikant. 839 Flatten sie 
jedoch wegen der gerichteten Vorhersage einen einseitigen t-Test durchgefiihrt, hatte sich 
ein t emp = 2,08 ergeben. 840 Er ist mit einer Uberschreitungswahrscheinlichkeit von p = 
0,023 verbunden, die genau gleich der Halfte der Uberschreitungswahrscheinlichkeit fur 
den F-Test ist. 

Werden flir verschiedene Bedingungskombinationen Mittelwertsvorhersagen in 
unterschiedliche Richtungen gemacht, mtissen auch die Alternativhypothesen der 
entsprechenden t-Tests unterschiedlich gerichtet sein. 

0 Im Experiment von Frey und Irle gab es neben der Bedingung mit Entscheidungsfreiheit 
und Offentlichkeit (EO+) noch eine andere Bedingung, in der kein expliziter Hinweis auf 
eine Entscheidungsfreiheit gegeben wurde und der Aufsatz anonym bleiben sollte (EO-). 
Hier sollte nach den theoretischen Uberlegungen der Autoren keine Dissonanz auftreten, 
sondern die Belohnung als Verstarkung wirken. Aus dieser zweiten empirischen 
Hypothese folgt eine Mittelwertsvorhersage in anderer Richtung: Bei 8 DM Belohnung 
soil die Einstellungsanderung groBer sein als bei 1 DM, die Meinungsauspragung soil in 



839 

Da der empirische p-Wert nur ganz knapp unter dem gewahlten Signifikanzniveau liegt, 
bestand ein erhebliches Risiko, dass der F-Test nicht signifikant wurde und die 
dissonanztheoretische Hypothese nicht als bestatigt interpretiert werden konnte. 

840 Bei zwei Gruppen ist t stets gleich der Wurzel aus F (Bortz, 1999, S. 82-83). 
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der ersten Gruppe also positiver bleiben: y 21 > y 22 . Auch bei dieser gerichteten 
Vorhersage sollte statt eines F-Tests ein einseitiger t-Test angewendet werden. 841 

Bei einem einseitigen Test konnen Ergebnisse in der nicht erwarteten Richtung 

logischerweise nicht signifikant werden, unabhangig davon wie groB sie sind. Dies 

ist solange kein Nachteil wie wir liber einen Test tatsachlich genau eine empirische 

Hypothese mit einer gerichteten Vorhersage priifen. Falls allerdings die Abweichung 

in der nicht erwarteten Richtung eine besondere inhaltliche Bedeutung hat, sollte 

statt eines ein- ein zweiseitiger Test durchgefuhrt werden. 842 Dies ist insbesondere 

dann der Fall, wenn zwei psychologische Hypothesen mit kontraren Vorhersagen an 

den gleichen Daten gegeneinander gepriift werden. 

. • • • • 

0 Neben den beiden bisher erwahnten Bedingungen EO+ und EO- haben Frey und Irle die 
Wirkung der beiden Belohnungshohen noch in zwei weiteren Bedingungskombinationen 
untersucht: mit expliziter Entscheidungsfreiheit, aber anonym (E+0-) und ohne explizite 
Freiheit, aber mit Ankiindigung einer Veroffentlichung (E-0+). Fur diese beiden 
Zwischenbedingungen lasst sich nicht eindeutig begriinden, ob die Giiltigkeit der 
Dissonanztheorie oder der Verstarkungstheorie zu erwarten ist. Um den Geltungsbereich 
beider Theorien gegeneinander abzugrenzen, sind systematische Mittelwertsunterschiede 
in beiden Richtungen relevant. Deshalb ist es hier besser, statt einseitiger zweiseitige t- 
Tests zu verwenden. 

Wahl zwischen verschiedenen Tests 

Die gleichen Hypothesen wie der Iibliche t-Test priift der sog. Welch-Test , der 
weniger Freiheitsgrade hat und bei ungleichen Varianzen robuster ist. 843 Struktur- 
gleich empirischen Vorhersagen der Form y 2 > y, sind auch die Alternativ- 
hypothesen von einseitigen Mann-Whitney-Wilcoxon-Rangtests sowie von einseiti- 
gen Permutationstests, die auf Mittelwertsdifferenzen ansprechen. 

Fur empirische Vorhersagen tiber die GroBenordnung der abhangigen Variablen 
in zwei Gruppen stehen also verschiedene statistische Tests zur Verfligung, bei 
denen die Hypothesenvaliditat nicht gestort ist. In den meisten Fallen kann ohne 
Bedenken der iibliche t-Test verwendet werden. Bei der Priifung von empirischen 
Hypothesen fur bestimmte Anwendungsfalle kann er gut als approximativer 



841 

Definiert man bei der Berechnung des t-Tests wie bisher die Bedingung A 2 (8 DM) als 
die erste, ist ein negativer t-Wert zu erwarten (siehe oben FuBnote 725, Seite 340). 

842 Keppel (1991, S. 123), Abelson (1995, S. 57-59), Leventhal & Huynh (1996) 

843 Hager, Liibbeke & Hiibner (1983), Hays (1994, S. 322, 328), (Keppel, 1991, S. 125), 
Rasch (1995, S. 343-345), Winer et al. (1991, S. 66-69), Zimmerman & Zumbo (1993). 
In SPSS wird jeder t-Test auch in dieser allgemeineren Form fur ungleiche Varianzen 
berechnet. 

844 siehe oben Abschnitt 15.3 
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Permutationstest interpretiert werden. Will man tatsachlich einmal Aussagen liber 

o A c 

zugrunde liegende Populationen treffen, ist der t-Test relativ robust und effizient. 

Um die Gefahr von Fehlentscheidungen liber die empirische Hypothese zu 
verringern, kann man aber auch mehrere hypothesenvalide Tests durchflihren und 
sich bei divergierenden Ergebnisse kriterienorientiert entscheiden. 

In den allermeisten Fallen werden die Ergebnisse der Tests tendenziell 
iibereinstimmen: Entweder sind alle signifikant oder alle sind insignifikant. Nur 
selten sind die Tests teilweise signifikant, teilweise aber nicht. In diesen Fallen kann 
man gezielt eine Entscheidungsalternative praferieren, falls einer der Aspekte der 
Validitat, Strenge bzw. Wohlwollen, deutlich wichtiger ist als der andere. Spricht 
beispielsweise ein signifikantes Ergebnis fiir die empirische Hypothese und will man 
diese moglichst streng priifen, entscheidet man sich schon gegen ihre Gtiltigkeit, 
wenn einer der durchgefiihrten Tests insignifikant bleibt. Will man hingegen die 
empirische Hypothese zunachst wohlwollend priifen, kann man sie eventuell schon 
dann als bewahrt ansehen, wenn einer der Tests signifikant wird. 



16.3 Vorhersagen tiber Gleichheit von Mittelwerten 

Bisher haben wir den weitverbreiteten Fall betrachtet, dass eine empirische 
Hypothese durch die Akzeptierung einer gerichteten Altemativhypothese gestiitzt 
wird. Mitunter sind psychologische Hypothesen aber auch so formuliert, dass die 
Akzeptierung oder Ablehnung von ungerichteten statistischen Hypothesen fiir sie 
spricht. 

Aus einigen psychologischen Hypothesen kann nur die Ungleichheit von 
Statistiken vorhergesagt werden, ohne dass die Richtung spezifiziert werden kann. 
Diese Vorhersagen sind strukturgleich mit den ungerichteten Alternativhypothesen 
einer Varianzanalyse oder eines zweiseitigen t-Tests. Wegen ihres geringen Gehaltes 
sind sie fiir wissenschaftliche Erklarungen und praktische Anwendungen nur wenig 
niitzlich. Lediglich Storhypothesen sind auch dann bedeutsam, wenn sie ungerichtet 
sind. 

0 Zur Untersuchung des Zusammenhangs von Belohnungshohe und Meinungsunterschied 
haben wir neben der UV “Belohnungshohe” die mogliche Storvariable “Untersuchungs- 
situation” als Kontrollfaktor B mit zwei Auspragungen (Luxushotel vs. Institutskeller) 
eingefuhrt (siehe oben Kapitel 14.4, Seite 318). Wenn die Untersuchungssituation eine 

Storvariable der internen Validitat ist, miissten die Mittelwerte der AV in den beiden 

846 

Bedingungen Bi und B 2 sich unterscheiden: y x ^ y 2 . 



845 siehe oben Abschnitt 15.2.3 

846 Die Akzeptierung der Altemativhypothese spricht daflir, dass die Untersuchungs- 
situation ein Storfaktor gewesen ware, falls sie zwischen den Auspragungen des experi- 
mentellen Bedingungsfaktors A systematisch variiert hatte. Wenn dieser mogliche 
Storfaktor als Kontrollfaktor eingefuhrt wird, kann er jedoch kein tatsachlicher Stor- 
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0 Konnen bei der Evaluation eines Therapie- oder Interventionsprogramms die Probanden 
nicht zufallig der Behandlungs- und Kontrollgruppe zugeordnet werden, muss versucht 
werden, die beiden Gruppen so zu parallelisieren, dass sie sich auf moglichst vielen 
wichtigen Variablen Yj nicht unterscheiden: y u = y 2i . 

Sehr bedeutsam konnen wissenschaftliche Hypothesen sein, die zu empirischen 
Vorhersagen liber die Gleichheit von Haufigkeiten oder Mittelwerten ftihren. 

0 Die Simulation menschlicher kognitiver Tatigkeiten ist erfolgreich, wenn die Arbeits- 
produkte eines Computers nicht mehr von entsprechenden menschlichen Produkten zu 
unterscheiden sind (sog. Turing-Test ). 847 Um ein Ubersetzungsprogramm zu evaluieren, 
legen wir professionellen Ubersetzern z.B. 30 verschiedene Ubersetzungen vor, jeweils 
zur Halfte vom Computer (Ai) und von Menschen (A 2 ). Die Personen mtissen jeweils 
beurteilen, wie sehr das Produkt einer fachgerechten Ubersetzung entspricht (Skala z.B. 
von 0 bis 10). Wenn die Simulation erfolgreich ist, ist zu erwarten, dass die Mittelwerte 
y, und y 2 gleich sind. Diese empirische Vorhersage ist strukturgleich mit der 
Nullhypothese eines zweiseitigen t-Tests. 848 

Besonders gehaltvoll sind psychologische Hypothesen, aus denen sich prazise 
empirische Vorhersagen liber den (Mittel-)Wert einer bestimmten Variablen oder die 
Haufigkeit eines bestimmten Ereignisses ableiten lassen. Auch in diesem Fall spricht 
die Akzeptierung der H 0 ftir die psychologische Hypothese. 

0 Nach der Theorie von Bower und Trabasso erfolgt der Erwerb eines Konzeptes nach 
einem Alles-oder-Nichts-Prinzip. Bis zur letzten fehlerhaften Antwort sollte die relative 
Haufigkeit fur richtige Antworten einer Person auf ein Item deshalb gleich der Rate- 
wahrscheinlichkeit, bei zwei Antwortalternativen also gleich 0,5 sein. 849 Diese 
Vorhersage kann durch einen Binomial test mit der Nullhypothese p = 0,50 gepriift 
werden. 

0 Nach einer Hypothese von Gigerenzer entsprechen die Schatzungen von A-posteriori- 
Wahrscheinlichkeiten den statistischen Werten nach dem Bayes-Theorem, falls die 
Personen Informationen liber absolute Haufigkeiten und nicht liber Wahrscheinlichkeiten 
erhalten. Ist ftir eine bestimmte Situation die statistische Wahrscheinlichkeit gleich 



847 

848 



849 

850 



faktor sein: Da jede Untersuchungssituation gleichhaufig unter jeder Belohnungs- 
bedingung auftritt, besteht zwischen Belohnung und Untersuchungssituation keine 
statistische Assoziation. 

Strube et al. (1996, S. 744) 

Allerdings ergibt sich diese empirische Vorhersage auch aus der Annahme, dass die 
Personen einfach zufallig antworten (weil sie z.B. die Aufgabe nicht verstanden haben, 
oder vollig unmotiviert sind). Um diese Alternativerklarung auszuschlieBen, kann man 
in das Beurteilungsmaterial einige Produkte einftigen, fiir die es relativ offensichtlich ist, 
dass sie von einem Computer bzw. von einem Menschen stammen. Hier mtissten sich 
die Mittelwerte deutlich unterscheiden. 

Liter & Spada (1990, S. 243), Wender (1990, S. 572) 

Gigerenzer & Hoffrage (1995), vgl. Anderson (1996a, S. 324-328) 
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dem Wert c, folgt daraus eine empirische Vorhersage y = c , die strukturgleich mit der 
Nullhypothese eines zweiseitigen t-Tests fiir eine Gruppe ist. 



16.4 Vorhersagen tiber Ordnungen mehrerer Mittelwerte 

Eine Annahme fiber den Zusammenhang zwischen Variablen ist in der Psychologie 
meist eine Annahme fiber ihren monotonen Zusammenhang. 

0 Nach Leon Festinger werden Meinungen nach kontrarem Verhalten um so starker 

85 1 

geandert, je weniger dieses Verhalten belohnt wird. 

852 

0 Nach Allen Paivio wird Material um so besser behalten, je bildhafter es ist. 

853 

0 Nach NarziB Ach sind Handlungen um so intensiver, je schwerer die Aufgabe ist. 

Bei einem monoton-steigenden Zusammenhang laufen die beiden Variablen in die 
gleiche Richtung: Je groBer die Werte auf der Variablen X sind, desto groBer sind sie 
auch auf der Variablen Y. Bei einem monoton-fallenden Zusammenhang sind die 
Variablenverlaufe gegenlaufig: Je groBer X, desto kleiner Y. 

Werden in einem Experiment von der unabhangigen Variablen zwei Auspragun- 
gen realisiert, fiihrt dies zu Vorhersagen fiber die Ordnung zweier empirischer 
Mittelwerte, die wir im Kapitel 16.2 besprochen haben. Werden drei oder mehr 
Auspragungen der unabhangigen Variablen realisiert, ergibt sich jeweils eine 
empirische Vorhersage wie y 3 > y 2 > oder allgemein yj > yj_j > ... > y, . 
Derartige Vorheragen fiber einen ordinalen Mittelwertstrend sind in der 

854 

psychologischen Forschung auBerordentlich haufig. 

0 Das dissonanztheoretische Bereichselement zur Forced Compliance (DissF, siehe oben 
Kapitel 11.4.1) enthalt einen monoton-steigenden Zusammenhang zwischen der Beloh- 
nungshohe und dem Meinungsunterschied. Wiirden wir in einem Experiment eine 
negative Meinung vertreten lassen und drei Belohnungshohen realisieren (z.B. 1 DM, 8 
DM und 20 DM), erhalten wir als empirische Vorhersage y 3 > y 2 > y, . 

Je groBer die Zahl J der Experimentalbedingungen ist, desto schwerer wird es (unter 
sonst gleichen Bedingungen) der empirischen Hypothese gemacht, sich zu bewahren. 
Die Strenge der Prtifung steigt also ceteris paribus mit zunehmender Zahl von 
Mittelwerten, fiir die eine Ordnung vorhergesagt wird. 

16.4.1 Inadequate Prufungen durch globale Tests 

Vorhersagen iiber einen ordinalen Mittelwertstrend wie y 3 > y 2 > werden in der 
Psychologie haufig gepriift, indem lediglich eine Varianzanalyse durchgefiihrt wird. 



Festinger (1978, S. 96-102), vgl. oben Kapitel 11.4.1 

852 Paivio & Csapo (1969), vgl. Anderson (1996a, S. 103-104) 

853 Heckhausen (1989, S. 14) 

854 

Braver & Sheets (1993) ermittelten in einer Stichprobe einen Anteil von 50%. 
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Diese priift die Nullhypothese der Gleichheit der Mittelwerte (H 0 : P 3 = M 2 = Pi) 
gegen die Alternativhypothese, dass mindestens zwei der Mittelwerte ungleich sind 
(Hp p 3 -t p 2 oder p 2 ^ Hi oder p 3 ^ p^. Die empirische Vorhersage ist in diesem Fall 
also nicht strukturgleich mit einer der geprtiften statistischen Flypothesen, weder mit 
Flo noch mit H ( . Die Signifikanz des varianzanalytischen F-Tests, d.h. die 
Akzeptierung der Hj spricht damit nicht eindeutig fur die empirische Vorhersage. Sie 
kann vielmehr durch zahlreiche Mittelwertsrelationen zustande gekommen sein, die 
nicht der empirischen Vorhersage entsprechen, beispielsweise y 3 < y 2 < y, oder y, 
> y 3 > y 2 oder y 3 = y 2 > y, usw. 

Bei einem signifikanten varianzanalytischen F-Test ist deshalb zusatzlich zu 
prlifen, ob die Rangordnung der Mittelwerte der empirischen Vorhersage entspricht. 
Diese Entscheidung wird haufig durch einfache Dateninspektion getroffen: Man 
schaut, ob die empirischen Mittelwerte mit der vorhergesagten Rangordnung iiber- 
einstimmen. Damit ist aber ein wesentlicher Teil der Entscheidung iiber die 
empirische Hypothese nicht mehr durch ein Signifikanztestergebnis abgesichert. Das 
Risiko, dass die Ordnung der empirischen Mittelwerte zufallig zustande gekommen 
ist, ist deshalb nicht hinreichend kontrolliert. Dadurch kann das Risiko fur falsche 
Entscheidungen iiber die EH (in unbekanntem MaBe) erhoht sein. 

16.4.2 Adaquate Prufungen durch geplante Kontraste 

Um empirische Vorhersagen iiber einen monotonen Trend von mehr als zwei Mittel- 
werten strukturerhaltend (homomorph) auf solche statistische Hypothesen abbilden 
zu konnen, die direkt durch Signifikanztests gepriift werden konnen, muss man 
gezielt jeweils die benachbarten Gruppen miteinander vergleichen . 855 Vor diesen 
gezielten Vergleichen kann ein globaler Test durchgefiihrt werden, um zu priifen, ob 
iiberhaupt systematische Unterschiede zwischen den betrachteten Gruppen 
bestehen . 856 Daraus ergibt sich ein zweistufiges Vorgehen: 

• Man fiihrt zunachst einen Overall- oder Omnibus - Test iiber alle J Mittelwerte 
durch, beispielsweise eine einfaktorielle Varianzanalyse. Ergibt dieser Overall- 
Test ein insignifikantes Ergebnis, spricht dies gegen die empirische Hypothese. 
Weitere Auswertungsschritte sind nicht notwendig. Eine Entscheidung gegen die 
EH ist allerdings nur dann gerechtfertigt, wenn die Teststarke hoch genug 

OCT 

gewesen ist (siehe unten Kapitel 17.1.2). 



Hager & Westermann (1983a, 1983c), Westermann & Hager (1983a) 

856 

Die verschiedenen moglichen Strategien im Umgang mit unspezifischen globalen Tests, 
gezielt geplanten Vergleichen und unabgesicherten Dateninspektionen hat Hager (1987, 
S. 180-183) herausgearbeitet und gegentibergestellt. 

857 Wenn die Auspragungen der UV quantitativ abgestuft sind, kann man als Overall-Test 
auch einen Mittelwertskontrast (siehe unten in diesem Kapitel) verwenden, der die 
Nullhypothese der Gleichheit aller Mittelwerte gegen die Alternative eines linearen 
Trends priift (Bortz, 1999, Kap. 7.4; Hays, 1994, Kap. 16.13). In SPSS sind diese 
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• Ergibt die Varianzanalyse ein signifikantes Ergebnis (d.h. unterscheiden sich die J 
Mittelwerte auf irgendeine Weise), prtift man mit Hilfe von J - 1 t-Tests, ob die 
Mittelwerte aufeinander folgender Bedingungen sich entsprechend der empiri- 
schen Vorhersage in der richtigen Richtung unterscheiden. 

0 Bei der Vorhersage y 3 > y 2 > V fuhrt man nach einem signifikanten varianzanalytischen 
F-Test zwei t-Tests durch, die die Alternativhypothesen Li ; > lu und p 2 > Li haben. 

Diese gezielten Tests benachbarter Gruppen haben einen wesentlichen Vorteil: 

• Die Konjunktion der J - 1 Alternativhypothesen ist Equivalent zur Aussage 
Bj > Ki- ! > ... > (ij und damit strukturgleich mit der empirischen Vorhersage liber 
den monotonen Mittelwertstrend. 

Man kann mit Hilfe der gezielten Tests also eindeutig entscheiden, inwieweit die 
empirischen Daten der vorhergesagten Mittelwertsordnung entsprechen. Nur wenn 
die Alternativhypothesen aller J - 1 paarweisen Mittelwertsvergleiche angenommen 
werden, spricht dies eindeutig fur die empirische Hypothese. 858 

Da die Mittelwerte bei diesem Entscheidungskriterium nicht nur in der vorher- 
gesagten Reihenfolge liegen miissen, sondern sich auch alle in der vorhergesagten 
Richtung signifikant und hinreichend deutlich unterscheiden miissen, wird es der 
empirischen Hypothese sehr schwer gemacht, sich zu bewahren. AuBerdem benotigt 
man sehr viele Untersuchungsfalle, um fiir alle Mittelwertsvergleiche eine hinrei- 
chend groBe Teststarke zu erreichen. 859 Will man die empirische Hypothese wohl- 
wollender priifen, kann man aber ohne Probleme schwachere Entscheidungskriterien 



Trendtests z.B. im Menu Mittelwerte vergleichen - Einfaktorielle ANOVA - Kontraste 
verfiigbar. 

Es gibt spezielle Tests von Bartholomew, von Jonckheere und von Page zur Priifung 
von ordinalen Mittelwertstrends (Bortz et al., 1990; Braver & Sheets, 1993). Die 
Alternativhypothesen dieser Tests sind jedoch nicht stmkturgleich mit den iiblichen 
empirischen ordinalen Mittelwertsvorhersagen, da sie alle moglichen schwachen 
Ordnungen zulassen, d.h. beispielsweise auch die Gleichheit fast aller Mittelwerte. 
Diese Verfahren sind deshalb nur als Overall-Test geeignet. Sie sind allerdings nicht in 

den verbreiteten statistischen Analysesystemen enthalten. 

858 

Zur Priifung von Vorhersagen liber die Rangordnung von J Mittelwerten geniigen die 
J-l paarweise t-Tests benachbarter Mittelwerte vollkommen, der varianzanalytische 
Overall-Test ist eigentlich entbehrlich (Westermann & Hager, 1983a; Wilcox, 1995). In 
einigen Fallen kann er sogar insofern irrefiihrend sein, als er insignifikant bleibt, obwohl 
einige paarweise Tests signifikant werden. Ein Overall-F-Test vor gezielten Mittelwerts- 
vergleichen wird hier aus pragmatischen Griinden empfohlen: Die varianzanalytische 
Datenauswertung ist so fest als Konvention etabliert, dass die meisten Herausgeber und 
Gutachter, unbeirrt von alien gegenteiligen Argumenten, varianzanalytische F-Tests fur 

unverzichtbar halten. 

859 

In der Simulation von Braver & Sheets (1993) zeigte das Verfahren der paarweisen 
Mittelwertskontraste nur eine auBerst geringe Teststarke, weil schon die Teststarke der 
Einzeltests teilweise sehr gering war. 
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anwenden. Beispielsweise konnte man die EH schon als (ausreichend) empirisch 
bestatigt ansehen, wenn alle Mittelwerte in der richtigen Ordnung liegen und min- 
destens die Halfte der Vergleiche signifikant wird. 

Ein Nachteil mehrfacher Signifikanztests ist die Kumulation von Fehlerwahr- 
scheinlichkeiten. Wie im Kapitel 17.2 gezeigt wird, kumuliert im vorliegenden Fall 
die Wahrscheinlichkeit (3 fur einen Fehler 2. Art. Dies ftihrt zu einer Erhohung der 
Strenge und zu einer Herabsetzung des Wohlwollens der Priifung. Ausgeglichen 
werden kann dies durch eine Erhohung der Teststarke der einzelnen t-Tests. 

Fiihrt man, wie in unserem Fall, verschiedene Signifikanztests innerhalb einer 
Menge von Faktorauspragungen oder Bedingungskombinationen durch, spricht man 
von multiplen Vergleichen (multiple comparisons). Jeder dieser Tests wird als 
Einzelvergleich oder Kontrast bezeichnet. Wenn die durchzuflihrenden Gruppen- 
vergleiche, wie in unserem Fall, durch die psychologische Hypothese bestimmt 
werden und vor der Erhebung der Daten festgelegt werden konnen, werden sie als A- 
priori-Kontraste oder geplante Vergleiche bezeichnet. 

Nicht nur die Vorhersagen fiber monotone Mittelwertsordnungen, die wir in 
diesem Kapitel betrachten, sind strukturgleich mit den konjugierten Alternativ- 
hypothesen von A-priori- Kontras ten. Auch die meisten anderen empirischen 
Vorhersagen, die wir in der psychologischen Forschung finden, lassen sich durch 
Kontraste valider priifen als durch globale, varianzanalytische Tests. 860 

Kontraste als Linearkombination 

Anschaulich gesprochen ist ein Kontrast ein statistischer Vergleich von zwei 
Gruppen von Mittelwerten. Formal charakterisiert wird er durch die Koeffizienten 

oz. 1 

einer Finearkombination: 

(16-1) Dj =c lj y 1 +... + c mj y m . 

Die sog. Kontrastkoeffizienten in dieser Linearkombination geben an, welche 
Variablen auf welche Weise zusammengefasst und dann verglichen werden. Die 
Koeffizienten der einen Variablengruppe haben positive, die der anderen negative 
Vorzeichen, und sie miissen so gewahlt werden, dass ihre Gesamtsumme Null ist. 862 



Hager & Westermann (1983a, 1983c), Westermann & Hager (1983a), Rosenthal & 
Rosnow (1985), Keppel (1991), Hager (1992b), Judd et al. (1995), Abelson & Prentice 
(1997), McClelland (1997), Wilkinson et al. (1999), siehe auch unten Kapitel 16.5.2 zur 
Priifung von Vorhersagen liber bestimmte Interaktionen und Moderatoreffekte 

861 Bortz (1999, S. 252-260), Hager (1987, S. 156-160), Hays (1994, Kap. 11), Keppel 
(1991, Kap. 6), Rosenthal & Rosnow (1985) 

862 Zur besseren Interpretation sollte auBerdem die Summe der positiven und der negativen 
Koeffizienten gleich +1 bzw. -1 sein. Der resultierende Wert des Kontrasts ist dann 
genau gleich der interessierenden Mittelwertsdifferenz. 

Aus statistischer Perspektive ist es vorteilhaft, wenn geplante Kontraste paarweise 
orthogonal sind: Ein varianzanalytischer F-Test liber J Gruppen kann in J - 1 orthogo- 
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Die vom t-Test gepriifte exakte Nullhypothese lautet 



(16 2) Aj + ... + 0. 

0 In einer Untersuchung zum Erfolg sechs unterschiedlicher Behandlungsarten fur 

Depressionen gibt es J = 6 Gruppen: Die ersten beiden Gruppen bekommen zwei 

unterschiedliche neue Medikamente, die dritte Gruppe ein altes Medikament, die letzten 

drei Gruppen unterschiedliche Psychotherapien. Will man als erstes prtifen, ob die Werte 

in den ersten beiden Gruppen im Mittel groBer sind als in den letzten drei Gruppen, 

konnen die Kontrastkoeffizienten folgendermaBen gewahlt werden: 

_ . i _ . i _ n _ i _ i _ i 

C 11 — C 12~ + J C 13 — 0 C 14 — J C 15 — 3 C 16 ~~ J * 

Der Kontrast lautet dann: 



(16-3) 



1 _ 1 _ 1 _ 1 _ 

D i = Tyi+Ty 2 -Ty4-Ty5 



2 ■> * 2 j * 3 

oder etwas anschaulicher geschrieben: 

(16-4) 



1 — 

^6 



D yi + y 2 y 4 + y 5 + y 6 



2 3 

Die Alternativhypothese, gegen die ein einsei tiger t-Test die entsprechende 
Nullhypothese priift, lautet in unserem Fall: 



(16-5) 



A = Ml±i(l_i(4±i(5±ik >0 
1 2 3 



oder: 



P1+P2 > P4+P5+P6 



2 3 

Mit einem zweiten Kontrast D 2 kann man beispielsweise prtifen, ob der Mittelwert der 
ersten Gruppe groBer ist als der zweiten. Als Koeffizienten wahlt man: 



c n 



1 

C 12 “ 2 



C 13 — 6 



Ci4=0 



C 15 — 0 



Ci6 = 0 . 



Die Alternativhypothese, gegen die dieser Kontrast priift, lautet dann: 

(16-6) A 2 - yPi ~~ yP 2 > 0 °der anschaulicher , 

Dies ist Equivalent zu p : > p 2 » der Alternativhypothese eines einseitigen t-Tests. 



Vl >t^2- 



Wahl der Priifvarianz 

Fur jeden A-priori-Kontrast wird eine t-Statistik berechnet und aus einer t-Verteilung 
die zugehorige Uberschreitungswahrscheinlichkeit p ermittelt. Es gibt dabei zwei 
Moglichkeiten, den im Nenner der t-Statistik stehenden Standardfehler zu definieren. 



nale Kontraste zerlegt werden, die unabhangige Informationsanteile reprasentieren. Fur 
eine valide Prtifung empirischer Hypothesen ist jedoch viel wichtiger, die Kontraste 
strukturgleich zu den empirischen Vorhersagen zu wahlen. Man kann dann ohne 
Bedenken nicht-orthogonale Kontraste verwenden (Hager, 1987, S. 168-171; Keppel, 
1991, S. 136-138; Rosenthal & Rosnow, 1985; Winer et al., 1991, S. 146-166). 

In SPSS konnen beliebige Kontrastkoeffizienten im Menu Mittelwerte vergleichen - 
einfaktorielle ANOVA sowie liber Syntaxbefehle (GLM) eingegeben werden. Im 
Allgemeinen linearen Modell konnen nur bestimmte Kontraste ausgewahlt werden, unter 
anderem zwischen aufeinanderfolgenden Gruppen (“wiederholte Kontraste”). Die p- 
Werte sind zweiseitig, bei gerichteten Vorhersagen also zu halbieren. 

863 Der zweiseitige t-Test ist Equivalent zu einem F-Test mit einem ZEhlerfreiheitsgrad. 
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• Konnen die Varianzen in alien untersuchten Gruppen als gleich groB 
angenommen werden, kann der Standardfehler aller Kontraste aus der 
varianzanalytischen Fehlervarianz (mittlere Quadratsumme innerhalb der 
Gruppen) ermittelt werden, die aus den Varianzen in alien J untersuchten 
Gruppen berechnet wird . 864 

• Kann oder will man die Annahme der Varianzgleichheit nicht machen, berechnet 
man den Standardfehler nur aus den Varianzen der am Kontrast beteiligten 
Gruppen. Gehen nur zwei Gruppen in den Kontrast ein, ist das Ergebnis dann 
Equivalent mit dem iiblichen t-Test . 865 

Gehen alle untersuchten Gruppen in den Nenner der t-Statistik ein, bekommt sie 
mehr Freiheitsgrade und damit auch eine hohere Teststarke. Im iiblichem Fall von 
Vorhersagen iiber gerichtete Mittelwertsunterschiede wird dadurch wohlwollender 
gepruft: Ceteris paribus wird die Chance erhoht, zutreffende empirische Hypothesen 
als solche zu identifizieren. Es kann aber auch das Risiko steigen, unzutreffende 
empirische Hypothesen falschlicherweise als zutreffend anzunehmen. Will man 
Hypothesen vor allem moglichst streng prlifen, muss man also auf die Verwendung 
der gemeinsamen Fehlervarianz verzichten und schon bei der Testplanung die Zahl 
der Untersuchungseinheiten so wahlen, dass die angenommenen Effekte mit der 
gewlinschten Teststarke auch mit iiblichen t-Tests zu entdecken sind. 



Effektgrofien 

Die mit einem Kontrast Dj verbundene EffektgroBe wird so definiert, dass sie sich im 
Falle von zwei Mittelwerten auf die bekannte EffektgroBe d reduziert : 866 



( 16 - 7 ) 





Statt s p , der zusammengefassten Varianz aus den beteiligten Gruppen, kann dort auch 
die Wurzel aus der varianzanalytischen Fehlervarianz verwendet werden. 

Der vom Kontrast D aufgeklarte Varianzanteil kann in der iiblichen Weise als 

Ofn 

Quotient von Quadratsummen ausgedriickt werden: 



siehe oben FuBnote 811, Seite 381 

865 

In SPSS werden A-priori-Kontraste grundsatzlich mit der gemeinsamen Fehlervarianz 
gerechnet. Im Menu Mittelwerte vergleichen - einfaktorielle ANOVA (Syntax: ONEWAY) 
werden zusatzlich fiir den Fall ungleicher Varianzen t-Tests mit vergleichsspezifischen 
Fehlervarianzen gerechnet (Welch-Test, siehe oben FuBnote 843, Seite 397). Im 
Allgemeinen linearen Modell (Syntax: UNIANOVA) fehlt diese Moglichkeit. AuBerdem 
wird kein t-Wert ausgegeben, sondern ein Konfidenzintervall fiir den Kontrastwert. 

866 Hager (1996b, S. 92), Abelson & Prentice (1997, S. 318). Durch die Summe der 
quadrierten Gewichte im Nenner wird die GroBe des Kontrastes, die ja von der GroBe 
der gewahlten Gewichte abhangt, auf einen einheitlichen MaBstab relativiert. 
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(16-8) 



nl = 



QS 



D 



QS D + QSpehler 



16.4.3 Inadequate Prufung durch Post-hoc-Kontraste 

In der Forschungspraxis werden nach einer signifikanten Varianzanalyse haufig 
spezielle statistische Techniken fur Post-hoc-Kontraste durchgefiihrt, beispielsweise 
Scheffe-Tests oder Tukey-Tests. 868 Sie priifen stets zweiseitig und gleichen die 
Kumulation der Fehlerwahrscheinlichkeit a fur den Fall aus, dass alle moglichen 
Mittelwertskontraste ( Scheffe-Tests ) bzw. alle moglichen paarweisen Mittelwerts- 
vergleiche ( Tukey-Tests ) durchgefiihrt werden. Sie sind damit allenfalls fur 
explorative Untersuchungen angemessen, d.h. wenn tatsachlich keine spezifischen 
Hypothesen oder Vorhersagen vorliegen, wenn alle moglichen (paarweisen) 
Kontraste gleichermaBen von Interesse sind oder wenn nach der Hypothesenprufung 
noch unerwartete Effekte in den Daten identifiziert werden sollen. Zur gezielten 
Prufung von Flypothesen sollten sie jedoch nicht eingesetzt werden: 

• Durch die zweiseitige Prufung besteht keine Strukturgleicheit zur empirischen 
Vorhersage. 

• Sie kontrollieren die Kumulation der a-Wahrscheinlichkeiten, bei den ublichen 
empirischen Vorhersagen muss jedoch die Kumulation von (3 kontrolliert werden. 

• Die a-Adjustierung bezieht sich auf eine groBe Familie von moglichen 
Vergleichen und ist deshalb sehr stark. 

• Durch die zweiseitige Prufung und die starke a-Adjustierung wird die Teststarke 
gegeniiber den interessierenden Mittelwertskonstellationen erheblich vermindert. 

Insgesamt vermindern Post-hoc-Tests die Wahrscheinlichkeit, dass zutreffende 
empirische Hypothesen tatsachlich akzeptiert werden (Wohlwollen der Prufung). 



16.5 Vorhersagen tiber Interaktionen zwischen Variablen 

In der Psychologie wird nicht nur die kausale Wirkung einer (unabhangigen) 
Variablen auf eine andere (abhangige) Variable untersucht. Von besonderem 
fachlichem Interesse ist vielmehr das Zusammenwirken verschiedener unabhangiger 
Variablen in Bezug auf die abhangige Variable. Entsprechende psychologische 
Hypothesen ftihren haufig zu einer empirischen Vorhersage, nach der die Wirkung 



mit QS d = D 2 /(£c( /n ; ) (Hays, 1994, S. 431; Keppel, 1991, S. 129; Rosenthal & 
Rosnow, 1985, S. 14) 

zusammenfassend: Bortz (1999, S. 263-266), Games (1971), Hager (1987, S. 177-180), 
Hays (1994, S. 455-463), Keppel (1991, Kap. 8), Miller (1981), Toothaker (1993), 
Shaffer (1995), Winer et al. (1991, S. 169-197), Zwick (1993) 
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der unabhangigen Variablen A auf die abhangige Variable Y in ganz bestimmter 
Weise davon abhangt, welche Auspragung eine andere unabhangige Variable B hat. 

0 Frey und Irle erwarten aufgrund ihrer modifizierten Dissonanztheorie, dass beim 
freiwilligen und offentlichen Schreiben einstellungskontrarer Aufsatze (Bedingung EO+) 
bei 1 DM Belohnung eine groBere Meinungsangleichung (und damit eine weniger 
positive Meinung und ein geringerer Meinungsunterschied) auftritt als bei 8 DM 
Belohnung (Dissonanzeffekt): y n < y 12 . In der Bedingung EO- wird dagegen bei 1 DM 
eine kleinere Meinungsangleichung (und damit eine positivere Meinung) erwartet als bei 
8 DM (Verstarkungseffekt): y 21 > y 22 (siehe oben Seite 286). 

Eine derartige Abhangigkeit der Wirkung einer unabhangigen Variablen von der 
Auspragung einer anderen unabhangigen Variablen bezeichnet man als statistische 
oder varianzanalytische Interaktion. Um dies verstandlich zu machen, soli im 
folgenden Kapitel 16.5.1 der Begriff der statistischen Interaktion naher erlautert 
werden. Im Kapitel 16.5.2 kommen wir auf die Uberprlifung von Interaktions- 
vorhersagen zuriick. 

16.5.1 Definition und Veranschaulichung von statistischen Interaktionen 

Eine Interaktion im varianzanalytischen Sinn besteht genau dann, wenn Zellen- 
mittelwerte y- sich nicht additiv aus den Randmittelwerten ergeben. In diesem 
Fall ist die Gesamtwirkung auf die AV Y nicht allein aus der additiven Kombination 
der Wirkungen a j = y. ■ — y und bj = y i# - y der beiden Faktorenauspragungen zu 
erklaren: Zumindest fiir einige Zellen gibt es noch einen speziellen Effekt gy, der 
ungleich Null ist: 

(16-9) Yij = y+(y i .-y) + (y. j -y) + gi j . 

Der Wert gy spiegelt den Effekt wieder, der durch die Kombination der Auspra- 
gungen Aj und B ; entsteht. Er wird als Interaktionseffekt fiir diese Bedingungskombi- 
nation bezeichnet. Durch Umformung von (16-9) ergibt sich: 

(16-10) gy = Yij-yi. -y.j + y 

Der statistische Begriff der Interaktion hat also eine ganz spezifische Bedeutung. Er 
bezeichnet ein Zusammenwirken von zwei (oder mehr) unabhangigen Variablen auf 
eine abhangige Variable. Im Alltag sowie in der Sozial- und Personlichkeitspsycho- 
logie ist mit dem Begriff der Interaktion dagegen meist eine dynamische Interaktion 



869 Die grundlegenden Konzepte der Varianzanalyse sind bei Bortz (1999, Kap. 7, 8, 12) 
und besonders gut bei Hays (1994, Kap. 10-13) beschrieben. Wir nehmen hier der 
Einfachheit halber an, dass die empirischen Mittelwerte gleich den Erwartungswerten 
fur die Population sind und konnen damit im Moment von alien Problemen statistischer 
Schatzungen und Signifikanzen absehen. 
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gemeint: eine gegenseitige Kommunikation und Beeinflussung (von Personen oder 
Variablen). 

0 Theoretische Ansatze in der Personhchkeitspsychologie konnen danach unterschieden 
werden, ob sie Verhalten in erster Linie durch Personlichkeitseigenschaften, durch 
Situationsmerkmale oder durch die Interaktion von Person und Situation erklaren. 870 
Innerhalb des Interaktionsansatzes werden sowohl Interaktionen im statistischen wie im 
dynamischen Sinn analysiert, mitunter werden sie auch miteinander verwechselt. 

In einem Experiment mtissen die Faktoren jedoch voneinander unabhangig sein, sie 
dtirfen sich auf keinen Fall gegenseitig beeinflussen. 

0 Im Experiment von Frey und Irle darf die Belohnung, die eine Person bekommt (Faktor 
A), nicht davon abhangen, ob sie das einstellungskontrare Verhalten freiwillig und 
offentlich (Auspragung + des Faktors EO) oder ohne Entscheidungsfreiheit und anonym 
(Auspragung - von EO) zeigt. Fur jede Person wird deshalb zufallig bestimmt, unter 
welcher der vier Auspragungskombinationen sie untersucht wird. 

Auch wenn zwei experimentelle Faktoren voneinander unabhangig sind, konnen sie 
doch in einer statistischen Interaktion stehen. Dies bedeutet, dass ihre Wirkungen auf 
eine dritte Variable voneinander abhangen: Die Wirkung des einen Faktors ist nicht 
ftir alle Auspragungen des anderen Faktors gleich. 

Um das Konzept der statistischen Interaktion und verschiedene Typen von 
Interaktionen zu verdeutlichen, gehen wir von einem typischen zweifaktoriellen 
Versuchsplan aus. In Tabelle 16.1 sind die Bezeichnungen ftir die verschiedenen 
Mittelwerte enthalten. 



Tabelle 16.1: Bezeichnung der Zeilen- und Randmittelwerte in einem 

zweifaktoriellen Versuchsplan 





Ai 


A2 




Bi 


y 11 


y 12 


y 1. 


b 2 


yn 


y 22 


y 2. 


b 3 


y 31 


y 32 


y 3 . 




y.i 


y.2 


y.. 



0 Ftir die Bedingung EO+ prlifen wir die dissonanztheoretische Hypothese zum 
Zusammenhang zwischen Belohnung (Faktor A: 10 vs. 80 DM) und Meinung (abhangige 
Variable Y) unter drei verschiedenen situationalen Umstanden (Faktor B: Luxushotel, 
Schulklasse, Institutskeller). 

Gilt das modifizierte Forced-Compliance-Element DissF.S in unserer Anwendungs- 
situation, sollten zum einen der Randmittelwert in der Bedingung A 2 groBer sein als in 
A\. y .2 > y m\. Zum anderen sollte sich diese Mittelwertsordnung auch unter alien drei 
situationalen Umstanden zeigen: y 12 > y n a y 22 > y 21 A y 32 > y 31- Die fiktiven 
Daten in Tabelle 16.2 entsprechen diesen Vorhersagen. 
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Olweus (1976), Magnusson & Endler (1977), Heckhausen (1989, S. 8-22), Fisseni 
(1998, S. 409-473) 
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Tabelle 16.2: Beispiel fur Haupteffekte und Interaktionseffekt 





Ai 


A2 




Bi 


54 


66 


60 


b 2 


48 


62 


55 


b 3 


33 


37 


35 




45 


55 


50 



Die Tabelle 16.2 enthalt ein Mittelwertsmuster mit zwei Haupteffekten und mit einer 
Interaktion. Die Haupteffekte der Faktoren A und B bestehen darin, dass die 
Randmittelwerte in den Spalten bzw. den Zeilen unterschiedlich sind. Die Interaktion 
zeigt sich zum einen darin, dass die Mittelwertsdifferenzen zwischen den beiden 
Spalten in den Zeilen ungleich sind: Sie betragen 12, 14 und 4. Auch die Differenzen 
zwischen den Zeilen in den beiden Spalten sind unterschiedlich. 

Eine Interaktion liegt also dann vor, wenn die Mittelwertsdifferenzen zwischen 
den Auspragungen der einen UV auf den Stufen der anderen UV verschieden sind. 
Die Differenzen zwischen den Randmittelwerten dieser UV werden dann nicht fiir 
alle Auspragungen der anderen UV genau repliziert. Insofern hangt die Wirkung der 
einen UV auf die AV davon ab, welche Auspragung die andere UV hat. 

Die numerische GroBe der Interaktionseffekte in den einzelnen Zeilen kann nach 
Ausdruck (16-10) bestimmt werden. Das Ergebnis findet sich in Tabelle 16.3. 



Tabelle 16.3: GroBe der Interaktionseffekte in Tabelle 16.2 





Ai A2 




Bi 

b 2 

b 3 


-1 +1 

-2 +2 

+3 -3 











Am starksten sind die Interaktionseffekte also in der Bedingung B 3 . 



Ordinale und disordinale Interaktionen 

Um adaquat uber empirische Hypothesen zu entscheiden, muss nicht nur die GroBe 
einer Interaktion betrachtet werden, sondern vor allem ihr Typ. Unterschieden wer- 
den muss insbesondere zwischen ordinalen und disordinalen Interaktionen. 871 Die In- 
teraktion in Tabelle 16.2 ist fiir beide Faktoren ordinal. In Tabelle 16.4 sind die 
Haupteffekte gleich geblieben, die Interaktion ist aber fiir einen Faktor disordinal. 



zur Definition, Klassifikation, graphischen Darstellung und Interpretation von 
Interaktionstypen: Aiken & West (1991), Boik (1993), Bortz (1999, S. 289-291), Bracht 
& Glass (1975), Bredenkamp (1975, 1980), Hager & Westermann (1983a, 1983b), 
Hager (1987), Jaccard (1998), Judd et al.(1995, S. 449-452), Rosnow & Rosenthal 
(1989, 1996) 
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Tabelle 16.4: Beispiel fur Haupteffekte und disordinalen Interaktionseffekt 





Ai 


A 2 




Bi 


53 


67 


60 


b 2 


46 


64 


55 


b 3 


36 


34 


35 




45 


55 


50 



Um zwischen ordinalen und disordinalen Interaktionen zu unterscheiden, miissen wir 
die Rangordnung der Zellenmittelwerte in den Zeilen und Spalten betrachten. 
Erleichtert wird dies durch Abbildung 16.2, in der die Mittelwerte aus Tabelle 16.4 
zweifach dargestellt sind. 





Abbildung 16.2: Typ der Interaktion fur Faktor A (links) und B (rechts) 

Links sind die Auspragungen des Zeilenfaktors B auf der Abszisse aufgetragen, 
rechts die Auspragungen des Spaltenfaktors A. Die Ordinate ist jeweils die AV Y. 
Wollen wir untersuchen, in welcher Weise die Wirkung der UV A von der Aus- 
pragung der UV B abhangt, miissen wir die Ergebnisdarstellung betrachten, in der 
die mogliche Moderatorvariable B auf der Abszisse abgetragen ist. 

• Ist die Ordnung der Mittelwerte in alien Zeilen gleich, ist eine bestehende Inter- 
aktion ordinal beziiglich des Spaltenfaktors, ansonsten ist sie disordinal. 

0 In Tabelle 16.4 entsprechen die Ordnungen der Zellenmittelwerte in den ersten beiden 
Zeilen B i und B 2 der Ordnung der Randmittelwerte y »i < y » 2 - In der Auspragung B 3 
haben wir dagegen die umgekehrte Reihenfolge: y 31 > y v. Die Interaktion ist 
disordinal beziiglich des Spaltenfaktors A. In der linken Darstellung iiberkreuzen sich 
deshalb die Linien fur die beiden Auspragungen von A. 

• Ist die Ordnung der Mittelwerte in alien Spalten gleich, ist eine bestehende Inter- 
aktion ordinal beziiglich des Zeilenfaktors, ansonsten disordinal. 

0 In Tabelle 16.4 ist die Rangordnung der Zellenmittelwerte in beiden Spalten gleich. 
Die Interaktion ist also ordinal beziiglich B. In der rechten Abbildung iiberkreuzen 
sich die Linien fur die drei Auspragungen des Zeilenfaktors dementsprechend nicht. 

• Ist die Ordnung der Mittelwerte in alien Zeilen und in alien Spalten gleich, ist 
eine bestehende Interaktion ordinal beziiglich beider Faktoren. 






Hypothesenvaliditat 



411 



0 In Tabelle 16.2 sind die Ordnungen der Zellenmittelwerte in den drei Zeilen gleich 
und entsprechen der Ordnung der Randmittelwerte: y «2 > y «i- Auch die Ordnung in 
den Spalten ist konstant und gleich der Ordnung der Randmittelwerte: y i» > y 2 » > 
y 3 #. In den beiden moglichen Darstellungen wiirden sich die Verbindungen zwischen 
den Mittelwerten nicht iiberkreuzen. 

Eine disordinale Interaktion beziiglich des hypothesenrelevanten Faktors bedeutet, 
dass sich das Wirkungsmuster dieses interessierenden Faktors nicht auf alien Stufen 
des zweiten Faktors wiederfindet. Dies kann zu einer Einschrankung des Geltungs- 
bereichs der untersuchten psychologischen Hypothese fiihren. 

0 In unserem fiktiven Experiment ergabe ein Datensatz wie in Tabelle 16.4 eine Besta- 
tigung der dissonanztheoretischen Hypothese nur auf den Stufen Bi und B 2 , nicht aber 
auf der Stufe B 3 . Danach wiirde der dissonanztheoretische Zusammenhang zwischen 
Belohnung und Meinungsanderung unter den unangenehmen Untersuchungsbedingungen 
nicht gelten . 872 

Bei einer ordinalen Interaktion muss in der Regel keine Einschrankung des Geltungs- 
bereichs vorgenommen werden. 873 Liegt iiberhaupt keine Interaktion vor, zeigt dies 
die Stabilitat des Haupteffekts tiber verschiedenen Bedingungen. 

16.5.2 Prtifung von Interaktionsvorhersagen 

Der varianzanalytische Interaktions-F-Test priift die Nullhypothese, dass keine 
Interaktion besteht, das heiBt dass die Interaktionskomponente y^ = p^ - p i# - p #J + p 
(vgl. oben (16-10) fur die beobachteten Werte) fur alle Zeilen gleich Null ist: 

(16-11) H 0 : £y?=0. 

(i.j) 

Die Alternativhypothese ist das logische Komplement zur Nullhypothese: 

(16-12) Hp 

(i.j) 

Die Alternativhypothese beinhaltet, dass irgendeine Interaktion besteht, d.h. dass 
irgendwelche Zeilen Interaktionskomponenten ungleich Null haben. 

Mit diesen Null- und Alternativhypothesen kann der varianzanalytische 
Interaktionstest auf keinen Fall zwischen ordinalen und disordinalen Interaktionen 
differenzieren. Er liefert auch keine Informationen dariiber, ob eine vorliegende 
Interaktion dem vorhergesagten Mittelwertsmuster entspricht oder nicht. 



872 

Ein empirisches Ergebnis, das zu einer derartigen Einschrankung des Geltungsbereichs 

ftihrt, miisste natlirlich moglichst repliziert und theoretisch erklart werden konnen. 

873 

Wenn nicht nur die Richtung der Effekte relevant ist, sondern auch ihre GroBe, ftihrt 
auch eine ordinale Interaktion zu einer Relativierung der Effekte. 
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0 Im (vereinfachten) Experiment von Frey und Irle konnen die empirischen Vorhersagen 
folgendermaBen zusammengefasst werden: 

(16-13) [y n < y 12 ] a [y 21 > y 22 ]. 

Die strukturgleiche Relation auf der Ebene der Erwartungswerte lautet 
(16-14) [pn <p 12 ] A [p 21 >p 22 ], 

Besteht eine derartige Beziehung zwischen den Erwartungswerten, liegt eine 
Interaktion im Sinne der Varianzanalyse vor. Umgekehrt folgt aus der Tatsache, 
dass eine Interaktion vorliegt, aber auf keinen Fall, dass die Mittelwertsordnungen 
von der vorhergesagten Art sind. 

Bei derartigen Interaktionsvorhersagen wird statistisch haufig nur geprtift, ob 
zwischen den Faktoren A und B eine Interaktion im varianzanalytischen Sinne 
vorliegt. 1st der varianzanalytische F-Test auf Interaktion signifikant, wird gefolgert, 
dass sich die entsprechende psychologische Interaktionshypothese bewahrt hat. 
Diese Argumentation ist jedoch nicht gerechtfertigt, denn die empirischen 
Vorhersagen, die aus psychologischen Hypothesen folgen, sind tiblicherweise weder 
zur Nullhypothese noch zur Alternativhypthese des varianzanalytischen 
Interaktionstests strukturgleich . 

Zwar fallen alle Parameterkonstellationen, die mit einer empirischen Interaktions- 
vorhersage strukturgleich sind, unter die Alternativhypothese des 

varianzanalytischen Interaktionstests, so dass die Akzeptierung der Nullhypothese 
dieses Tests gegen die empirische Hypothese spricht. Eine varianzanalytische 
Interaktion kann jedoch auch durch zahlreiche Konstellationen von 

Erwartungswerten zustande kommen, die nicht mit der empirischen Vorhersage 
strukturgleich sind. Eine signifikante Interaktion spricht also keineswegs eindeutig 
fur die empirische Hypothese. 

0 Auch die zur vorhersagekonformen Parameterkonstellation (16-14) inverse Konstellation 
(16-15) [p n >p 12 ] a [p 21 <p 22 ] 

ist eine Interaktion im varianzanalytischen Sinn, ebenso beispielsweise 
(16-16) [p n <p 12 ] a [p 21 =p 22 ], 

Ergeben sich aus psychologischen Hypothesen spezifische Interaktionsvorhersagen, 
gentigt es deshalb nicht, einen varianzanalytischen Interaktionstest durchzuflihren. 

• Nur wenn der Test (bei geniigend groBer Teststarke) insignifikant bleibt, kann die 
empirische Interaktionshypothese als unzutreffend abgelehnt werden. 

• Wenn sich ein signifikanter F-Wert im varianzanalytischen Test auf Interaktion 
ergibt, muss zusatzlich geprtift werden, ob die in den Daten vorliegende Inter- 
aktion systematisch mit der empirischen Vorhersage iibereinstimmt. 

Als erstes sollte man inspizieren, ob die empirischen Mittelwerte den vorhergesagten 
Rangordnungen entsprechen. Ist dies nicht der Fall, spricht das gegen die empirische 
Hypothese. Entsprechen die Mittelwerte jedoch der spezifischen Interaktions- 
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vorhersage, ist mit zwei gezielten Paarkontrasten zu priifen, ob diese vorhergesagten 

874 

Unterschiede als systematisch betrachtet werden konnen. 

0 Im Experiment von Frey und Irle ist die empirische Interaktionsvorhersage strukturgleich 
mit den Alternativhypothesen von zwei einseitigen t-Tests (p n <p 12 fur EO+ und 
jll 2 i > E 22 fur EO-). Frey und Irle gehen insofern einen richtigen Weg als sie die 
Mittelwerte in beiden Belohnungsbedingungen fur jede Auspragung des Faktors EO 
vergleichen. Sie verwenden aber nicht gerichtete t-Tests, sondern ungerichtete F-Tests 
und verschlechtern damit unwissentlich ihre Uberschreitungswahrscheinlichkeiten (siehe 
oben Seite 396). 

Dieses Prinzip kann vom 2-mal-2-Versuchsplan auch auf komplexere Vorhersagen 
ubertragen werden. Besonders haufig haben wir in der Psychologie Vorhersagen 
darliber, dass die GroBenordnung der Werte liber drei oder mehr Bedingungen sich in 
zwei oder mehr Auspragungen einer anderen unabhangigen Variablen unterscheidet. 

0 In einer Erweiterung des Experiments von Frey und Irle mit flinf gleich abstandigen 
Belohnungsbedingungen (1, 8, 15, 22 und 29 DM) werden fur die Bedingung EO+ 
groBere Einstellungswerte vorhergesagt ( Yu < yi 2 < Yi 3 < Yi 4 < Yis X fur die andere 
Bedingung EO- dagegen fallende ( y 21 > y 22 > y 23 > y 24 > y 25 ). 

Geprlift werden konnen derartige Vorhersagen wiederum durch gezielte Mittelwerts- 
vergleiche aller benachbarter Gruppen innerhalb der Auspragungen der zweiten 
Variablen. Man kann aber auch fur jede dieser Auspragungen einen Kontrast 
definieren, dessen Gewichte den jeweils erwarteten Trend widerspiegeln. 875 

0 Der erste Trendkontrast hat die Koeffizienten {-2, -1, 0, +l,+2}, der zweite Kontrast ist 
durch die Koeffizienten {+2, +1, 0, -1, -2} definiert. 

Diese Trendtests sind nicht so unspezifisch wie der varianzanalytische Interaktions- 
test, aber unspezifischer als die Vergleiche aller benachbarten Mittelwerte. Sie 
konnen auch signifikant werden, wenn nicht alle benachbarten Mittelwerte sich in 
der vorhergesagten Richtung unterscheiden. Die empirische Hypothese wird also 
wohlwollender und weniger streng geprlift. 
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Der varianzanalytische Interaktionstest kann als Overall-Test vorangestellt werden, ist 
aber nicht unbedingt notwendig (vgl. FuBnote 858, Seite 402). Um einzelne Zellen in 
einem zweifaktoriellen Plan mit J bzw. K Auspragungen zu kontrastieren, kann er in 
einen einfaktoriellen Plan umgewandelt werden, dessen Auspragungen die J mal K 
urpriinglichen Zellen sind. In SPSS werden dazu die beiden alten Kodiervariablen in eine 
neue transformiert. 

Rosenthal & Rosnow (1985, Kap. 3), Abelson & Prentice (1997), vgl. FuBnote 857, 
Seite 401 





17 Entscheidungsvaliditat 



In den vorangegangenen Kapiteln haben wir zwei wesentliche Aspekte der 
Statistischen Validitat betrachtet: die Signifikanztest- und die Hypothesenvaliditat. 
In diesem Kapitel wird dargestellt, wie die Validitat einer Untersuchung dadurch 
erhoht werden kann, dass die Ergebnisse der statistischen Datenauswertung optimal 
genutzt werden, um liber empirische Hypothesen zu entscheiden. 

Erstens darf die Entscheidung liber empirische und psychologische Hypothesen 
nicht nur von der Signifikanz des Tests abhangig gemacht werden. Systematisch 
berticksichtigt werden muss auch die GroBe des empirischen Effekts (Kapitel 17.1). 

Zweitens kann es zu einer Kumulation von Fehlerwahrscheinlichkeiten kommen, 
wenn mehrere Signifikanztests durchgefiihrt werden, um iiber die empirische 
Hypothese zu entscheiden. Je nach Art der empirischen Hypothese mtissen dabei die 
a- bzw. die |3-Fehlerkumulation beachtet und ausgeglichen werden (Kapitel 17.2). 



17.1 Entscheidungen iiber statistische und empirische Hypothesen 

17.1.1 Wichtigkeit von empirischen Effekten 

In den vergangenen Kapiteln wurde wiederholt auf die Wichtigkeit von empirischen 
EffektgroBen hingewiesen: 

• Bei statistischen Verfahren hangt der Wert einer Teststatistik von der Anzahl der 
Untersuchungsfalle und von der GroBe des empirischen Effektes ab. 

• Empirische Effekte sind unabhangig von der Anzahl der Untersuchungsfalle und 
driicken die Abweichung der Daten von der Nullhypothese aus. 



876 

Dabei setzen wir stets voraus, dass keine wesentlichen Storungen der internen Validitat 
vorliegen. Um die Sachverhalte einfach darzustellen, nehmen wir auBerdem an, dass die 
empirische Hypothese entweder akzeptiert oder abgelehnt werden soil. Tatsachlich muss 
man sich bei der Interpretation eines Experimentes natlirlich nicht unbedingt auf diese 
beiden Alternativen beschranken, sondern kann ihre Gultigkeit auch differenzierter 
beschreiben. 
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• Der Wert einer Teststatistik ist um so extremer, d.h. der Test fallt um so leichter 
signifikant aus, je groBer der empirische Effekt bei konstanter GruppengroBe ist 
bzw. je groBer die Zahl der Untersuchungsfalle bei konstantem Effekt ist. 

• Ein signifikantes Ergebnis in einem statistischen Test bedeutet nicht unbedingt, 
dass auch ein groBer Effekt vorliegt: Auch kleine Effekte konnen signifikant 
werden, wenn die Zahl der Falle hinreichend groB ist. 

• Auf der anderen Seite bedeutet ein insignifikantes Ergebnis nicht unbedingt, dass 
kein Effekt vorliegt, denn auch groBe Effekte konnen insignifikant bleiben, wenn 
die Fallzahl nicht groB genug ist. 

Wie in den vorangegangenen Kapiteln beschrieben, werden statistische Tests durch- 
geflihrt, um Aussagen liber wissenschaftliche oder psychologische Hypothesen zu 
treffen: Sind die Theorien, Modelle, Gesetzesannahmen usf. durch die Daten 
gestlitzt, mit den Beobachtungen vertraglich, auf die intendierten Situationen 
anwendbar? Die Verbindung zwischen psychologischen und statistischen 
Hypothesen haben wir liber die empirischen Hypothesen und Vorhersagen 
hergestellt. Auch umgekehrt fiihrt der Weg von den statistischen Ergebnissen 
zuriick zu den psychologischen Aussagen liber die empirischen Vorhersagen und 
Hypothesen. Die Entscheidungen auf unterschiedlichen Ebenen erfolgen dabei nach 
unterschiedlichen Kriterien: 

1. Eine empirische Vorhersage ist zutreffend, wenn die empirischen Statistiken in 
der vorhergesagten Relation stehen und wenn diese Effekte die erwartete GroBe 
haben. 

2. Die Akzeptierung oder Ablehnung der zugeordneten statistischen Hypothesen 

• • 

hangt sowohl von den Fehlerwahrscheinlichkeiten a und den Uberschreitungs- 
wahrscheinlichkeiten p ab als auch von den Fehlerwahrscheinlichkeiten (3, die fiir 
die angenommene EffektgroBe (die sog. Mindesteffekte) bestimmt worden sind. 

3. Eine Entscheidung liber eine empirische Hypothese sollte nur getroffen werden, 
wenn keine begriindeten Zweifel an der Validitat der Untersuchung bestehen. 

- Die empirische Hypothese wird vor allem dann akzeptiert, wenn die abgeleitete 
empirische Vorhersage zutreffend ist und wenn die zugeordneten statistischen 
Hypothesen akzeptiert wurden. 

- Sie wird vor allem dann abgelehnt, wenn die empirische Vorhersage nicht 
zutreffend ist und die zugeordneten statistischen Hypothesen abgelehnt 
wurden. 

- Ansonsten kann man sich je nach Fragestellung und Ergebnislage fiir die 
Akzeptierung oder Ablehnung der empirischen Hypothese entscheiden, man 
kann sich aber auch eines eindeutigen Urteils enthalten. 

4. Jede Entscheidung iiber eine empirische Hypothese wirkt sich unmittelbar auf 
die Bewertung der entsprechenden psychologischen Hypothese aus. 
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siehe oben Kapitel 16.1, Seite 387ff. und insbesondere Abbildung 16.1 
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- Wird die empirische Hypothese als zutreffend akzeptiert, hat die 
entsprechende psychologische Hypothese sich (in diesem Anwendungsfall) 
bewahrt und eine (zusatzliche) empirische Stiitzung erhalten. Die untersuchte 
Situation ist nicht mehr eine zweifelhafte, sondern eine erfolgreiche 
Anwendung. 

- Wird eine empirische Hypothese als unzutreffend abgelehnt, hat sich die 
psychologische Hypothese (in diesem Fall) nicht bewahrt. Sie kann dann auf 
zweierlei Weise modifiziert werden: indem die betrachtete Situation aus dem 
intendierten Anwendungsbereich eliminiert wird oder indem die Gesetzes- 
annahmen der Theorie umformuliert werden. Im Extremfall konnen die 
entsprechenden Theorie-Elemente vollstandig aufgegeben werden. 

Der zentrale Punkt in diesem Ablauf ist die Entscheidung iiber die empirische 
Hypothese: Ist im vorliegenden Anwendungsfall das interessierende Theorie- 
Element gliltig? Diese Entscheidung wirkt sich unmittelbar auf die Bewertung der 
allgemeineren psychologischen Hypothese aus. 

Im Folgenden wird dargestellt, wie wir systematisch zunachst liber statistische 

und dann iiber empirische Hypothesen entscheiden konnen. Damit soli nicht der 

Versuch gemacht werden, Entscheidungsstrategien zu etablieren, die zwingend 

vorgeschrieben sind und von denen man nicht abweichen darf. Die beschriebenen 

Strategien sind Vorschlage, wie man zu begriindeten und eindeutigen Entschei- 

dungen iiber empirische Hypothesen gelangt, indem man gezielt Informationen iiber 

Signifikanzen und EffektgroBen verbindet. Dies wird zunachst ausfiihrlich fiir den 

iiblichen Fall beschrieben, dass aus der empirischen Hypothese eine Vorhersage iiber 

die GroBenordnung zweier Mittelwerte abgeleitet wird und dann fiir weitere 

• • 

Situationen adaptiert. Eine Ubertragung auf andere Probleme ist ohne groBere 
Schwierigkeiten moglich. 878 

Folgt man den beschriebenen Strategien, wird die Entscheidung iiber die 
empirische Hypothese nicht nur von den tatsachlichen Ergebnissen bestimmt, 
sondern ganz wesentlich auch von den angenommenen EffektgroBen, die bei der 
Festlegung der Anzahl der Beobachtungen zugrunde gelegt wurden und mit denen 
man die erhaltenen Effekte vergleicht. Dies ist jedoch kein Nachteil. Wenn man 
keine EffektgroBen annimmt und keine adaquate Testplanung durchfiihrt, muss man 
die Zahl der Personen nach anderen Gesichtspunkten wahlen. Man kann sich an 
ahnliche Arbeiten anlehnen, sich auf die gerade verfiigbaren Studierenden 
beschranken usw. Wie wir im Kapitel 15.4 gesehen haben, ist mit der Festlegung von 
bestimmten GruppengroBen n, und n 2 jedoch eindeutig diejenige EffektgroBe 
determiniert, die man mit einer Wahrscheinlichkeit von z.B. l-(3 = 0,95 entdecken 
kann. 
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zu grundsatzlich ahnlichen, im Detail aber teilweise abweichenden Strategien: 
Westermann & Hager (1982), Hager (1984; 1987, S. 243-247; 1992a, 1992b) 
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Der immer noch tibliche Verzicht auf eine vorherige Testplanung mit einer 
expliziten und kritisierbaren Festlegung eines angenommenen Effekts ftihrt also 
dazu, dass der tatsachlich entdeckbare Effekt implizit festgelegt wird und in der 

070 

Regel unbekannt bleibt. 

17.1.2 Entscheidungsstrategie fur gerichtete Vorhersagen 

Wie Signifikanz und EffektgroBe bei der Entscheidung liber eine empirische 
Hypothese systematisch beriicksichtigt werden konnen, soli im Folgenden am 
Beispiel einer empirischen Vorhersage y 2 > y, iiber die Ordnung zweier Mittelwerte 
demonstriert werden. Die Priifung der zugeordneten statistischen Flypothese erfolgt 
durch einen einseitigen t-Test mit FI 0 : |i 2 _ (-f - Ound H t : )l 2 -p., > 0 . Das 
Signifikanzniveau sei mit a = 0,05 gewahlt. Zur Veranschaulichung dienen die 
Stichprobenkennwerte-Verteilungen in der Abbildung 17.1. 880 Sie reprasentieren die 
fur die Forschungspraxis typische Situation, dass die Zahl der untersuchten Falle 
eigentlich zu klein ist: Fur einen anzunehmenden Effekt 8 a ist die Fehlerwahr- 
scheinlichkeit 2. Art deutlich groBer als die Fehlerwahrscheinlichkeit 1 . Art. 




Abbildung 17.1: Ergebniskonstellationen bei gerichteter Mittelwertsvorhersage 

0 Im fiktiven Forced-Compliance-Experiment mit zwei Gruppen zu je 35 Personen ergab 
sich fur den einseitigen t-Test mit 68 Freiheitsgraden und a = 0,05 ein kritischer Wert t cr ; t 



Bredenkamp (1969b, S. 278-279) 

Die Abszisse stellt nicht, wie in Abbildung 15.2, Mittelwertsdifferenzen dar, sondern 
EffektgroBen und t-Werte, die nach (15-37) linear miteinander verbunden sind. Bei 
anders gerichteten Hypothesen, z.B. 1 I () : lk — 11 > 0 gegen If: lu — Li < 0 . muss auch 
eine Invertierung der Entscheidungskriterien erfolgen. 
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= 1,67 (siehe Seite 373). Die empirische EffektgroBe, die dementsprechend mindestens 
vorliegen muss, damit der Test signifikant ist, betragt nach (15-37) 



(17-1) 



d C iit k'lit 



n i + n 2 

n i n 2 



= 1,67 



'35 + 35 
35x35 



= 0,40. 



In der Abbildung 17.1 sind die kritischen t- und d-Werte eingezeichnet. Sie markieren die 
Grenze des Wertebereichs, der zur Ablehnung der Nullhypothese fiihrt. Fiir einen 
mittleren Effekt (8 a = 0,5) betragt die Wahrscheinlichkeit fiir einen Fehler 2. Art nach den 
Berechnungen auf Seite 374 (3 = 0,33. Diese Wahrscheinlichkeit liegt weit liber dem 

anzustrebenden Hochstwert von 0,05. Sie entspricht der Flache der 1 1 1 -Verteilung links 

881 

von der kritischen Grenze. 



In diesem Fall sind vier verschiedene Konstellationen von Ergebnissen und 
Entscheidungen moglich. Sie sind in der Abbildung 17.1 dargestellt. 



Konstellation I 

Der Test ist signifikant (t > t crit ) und der empirische Effekt d erreicht die 
angenommene minimale EffektgroBe (d > 8 a ). 

1. Die empirische Vorhersage ist zutreffend: Der Effekt ist von der erwarteten 
GroBe. 

2. a) Die Nullhypothese \i 2 - ib <0 wird abgelehnt. 

b) Die Alternativhypothese p 2 - Ma >0 wird akzeptiert. 

3. Die empirische Hypothese hat sich eindeutig bewdhrt und wird als zutreffend 

akzeptiert. 



Konstellation II 

Sowohl die Teststatistik als auch die EffektgroBe sind Null oder negativ (t < 0 < t crit 
und d < 0 < 8 a ). 

1. Die empirische Vorhersage ist nicht zutreffend: Der Unterschied liegt in der nicht 
erwarteten Richtung. 

2. a) Die Nullhypothese p 2 - Ma - 0 wird beibehalten. 882 

b) Falls die Teststarke 1 - (3 fur den angenommenen Mindesteffekt S a ausreichend 
groB ist (in der Regel mindestens 0,95), wird die spezifizierte, d.h. die um den 
Mindesteffekt erganzte Alternativhypothese p 2 -p, > 8 a abgelehnt. 



881 Nach der Testplanung aus Kapitel 15.5.6 muss man nj = n 2 = 87 Personen unter- 
suchen, um bei a = 0,05 mittelgroBe Effekte von 8 a = 0,50 mit einer ausreichenden 
Wahrscheinlichkeit von l-(3 = 0,95 als signifikant zu entdecken, falls sie tatsachlich 
vorliegen. Dann haben beide Verteilungen kleinere Standardabweichungen und 

iiberlappen sich nur noch zu 5% ihrer Flache. 

882 A A 

Eine dezidierte Akzeptierung der Nullhypothese ist nicht gerechtfertigt, weil 
Teststatistiken und EffektgroBen unter Null auch dann noch sehr wahrscheinlich sein 
konnen, wenn die Alternativhypothese gilt, die Parameterdifferenz aber klein ist. 





420 



Kapitel 17 



• • 

c) Uber die unspezifizierte Alternativhypothese |l 2 - bi >0 wird keine 
Entscheidung getroffen. 

3. Die empirische Hypothese hat sich nicht bewahrt. Sie wird abgelehnt, falls die 
spezifizierte Alternativhypothese abgelehnt worden ist. Sie kann auch abgelehnt 
werden, falls der empirische Effekt sehr deutlich in der vorhersagekontraren 
Richtung liegt. 

Konstellation III 

Der Test ist signifikant (t > t cr i t ), der empirische Effekt d erreicht aber nicht die 
angenommene minimale EffektgroBe (d < 8 a ). 

1. Die empirische Vorhersage ist eingeschrankt zutreffend: Die empirischen 

Mittelwerte haben die vorhergesagte GroBenordnung, der Unterschied ist aber 
kleiner als erwartet. 

2. a) Die Nullhypothese \x 2 -p, < Owird abgelehnt. 

b) Die Alternativhypothese ft 2 _ bi >0 wird akzeptiert. 

3. Die empirische Hypothese hat sich eingeschrankt bewahrt. Sie kann als 

zutreffend akzeptiert werden, falls auch kleinere als der angenommene Effekt 
inhaltlich interessant sind und insbesondere falls der empirische Effekt relativ 
dicht beim angenommenen liegt. 

Konstellation IV 

Der Test ist nicht signifikant (0 < t < t crit ) und der empirische Effekt d erreicht nicht 
die angenommene minimale EffektgroBe (0 < d < 8 a ). 

1. Die empirische Vorhersage ist eingeschrankt zutreffend: Die empirischen 

Mittelwerte haben die vorhergesagte GroBenordnung, der Unterschied ist aber 
kleiner als erwartet. 

2. a) Die Nullhypothese \x 2 ~ bi - 0 wird beibehalten. 

b) Die spezifizierte Alternativhypothese (l 2 “M-i > § a wird abgelehnt, falls daflir 

die Teststarke ausreichend groB ist (in der Regel mindestens 0,95). 883 
• • 

c) Uber die unspezifizierte Alternativhypothese |i 2 - bi >0 wi rd keine 
Entscheidung getroffen. 

3. Die empirische Hypothese hat sich iiberwiegend nicht bewahrt. 

- Sie kann abgelehnt werden, falls die spezifizierte Alternativhypothese 
abgelehnt worden ist oder falls der empirische Effekt relativ klein und 
inhaltlich nicht mehr von Interesse ist. 

- Sie soil jedoch nicht abgelehnt werden, falls die Teststarke nicht ausreichend 
hoch ist (d.h. unter 0,95 oder gar unter 0,80 liegt) oder wenn der empirische 
Effekt so groB ist, dass er noch von inhaltlichem Interesse ist. 
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Verschiedene Entscheidungsstrategien kommen in diesem Fall zu unterschiedlichen 
Empfehlungen (Hager, 1992a, 1992b; Westermann & Hager, 1982). 
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Von den betrachteten Konstellationen nicht mit abgedeckt wird der Fall, dass der 
Test insignifikant ist, der empirische Effekt aber den angenommenen Effekt 
uberschreitet (d.h. t < t cr i t und d > 8 a ). Diese Ergebniskombination kann nur eintreten, 

oo a 

wenn wegen zu geringer Fallzahlen die Teststarke unter 0,50 liegt. Dadurch geht 
man ein erhebliches Risiko ein, die empirische Hypothese falschlicherweise 
abzulehnen. Vermeiden kann man diese Validitatsstorung nur durch eine 
Testplanung, die zu einer ausreichend hohen Teststarke fiihrt. 

Mehrfache Tests 

Einige typische gerichtete Vorhersagen lassen sich nicht strukturgleich auf eine 
Hypothese eines einzigen Signifikanztests abbilden. Zur adaquaten Prlifung von 
Vorhersagen wie y 4 >y 3 >y 2 >yi oder [y , , < y l2 J a [y 2 1 > y 22 J mlissen jeweils 
zwei oder mehr Tests durchgeflihrt werden (siehe oben Abschnitte 16.4 und 16.5.2). 
Wenn alle Ergebnisse der einzelnen Tests zur gleichen Konstellation gehoren, 
konnen unsere Entscheidungsempfehlungen unmittelbar ubernommen werden. 

• Wenn alle Tests signifikant sind und alle empirischen EffektgroBen die ange- 
nommenen Mindesteffekte erreichen (Konstellation I), kann die empirische Hypo- 
these eindeutig akzeptiert werden. 

• Wenn alle Ergebnisse in vorhersagekontrarer Richtung liegen (Konstellation II), 
hat die empirische Hypothese sich eindeutig nicht bewahrt und kann, falls die 
Teststarken ausreichend hoch sind, abgelehnt werden. 

• Wenn die Einzelergebnisse alle der Konstellation III bzw. alle der Konstellation 
IV entsprechen, hat sich die empirische Hypothese eingeschrankt bewahrt bzw. 
iiberwiegend nicht bewahrt. 

Bei gemischten Ergebniskonstellationen sollten die Entscheidungen fallspezifisch 
getroffen und begrlindet werden. Zu berucksichtigen sind dabei Anzahl und Anteil 
der erreichten Signifikanzen, nicht minder aber auch die GroBe der empirischen 
Effekte. Ob man angesichts eines vorliegenden Ergebnismusters die empirische 
Hypothese eher als (eingeschrankt) bewahrt oder eher als (iiberwiegend) 
nichtbewahrt ansieht, ist vor allem davon abhangig zu machen, ob sie eher streng 
oder wohlwollend geprlift werden soil. 

• • 

Ubertragung auf andere Vorhersagen 

Die in den vier Konstellationen beschriebene Entscheidungsstrategie kann direkt auf 
alle Falle angewendet werden, in denen die empirische Vorhersage auf die 
Alternativhypothese eines einseitigen Tests mit einer zusammengesetzten 
Nullhypothese abgebildet wird. Sie gilt also beispielsweise auch unmittelbar fur 



884 



Wenn die kritische EffektgroBe cf. nl groBer ist als 8 a , liegt unterhalb von d ail mehr als 
die Halfte der Flache der Hi-Funktion und (3 liegt dementsprechend iiber 0,50. 
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empirische Vorhersagen iiber positive Korrelationen (t-Test mit H 0 : p < 0 und Hp p 
> 0). Fur andere Vorhersagestrukturen und Signifikanztests muss die Strategic 
grundsatzlicher angepasst werden. Im Folgenden wird die Adaptation fur 
ungerichtete und fur prazise Vorhersagen beschrieben. 

17.1.3 Entscheidungsstrategie ftir ungerichtete Vorhersagen 

Beim t-Test kann man den Rejektionsbereich gemaB der Struktur der empirischen 
Vorhersage gezielt am positiven oder am negativen Extrembereich lokalisieren 
(einseitiger Test), man kann den Rejektionsbereich aber auch auf beide Extreme 
aufteilen (zweiseitiger Test). Dadurch ist es moglich, sowohl gerichtete wie 
ungerichtete Hypothesen zu prlifen. 

Dagegen sind die F- und Chi-Quadrat-Tests stets einseitige Tests: Der Rejektions- 
bereich liegt immer im oberen Bereich. Da in die Teststatistiken stets quadrierte 
Abweichungen eingehen, konnen grundsatzlich nur ungerichtete Hypothesen gepriift 
werden. 885 Bei der Entscheidung iiber empirische Vorhersagen, die strukturgleich mit 
der Alternativhypothese eines F- oder Chi-Quadrat-Tests sind, entfallt deshalb die 
zweite der obigen Konstellationen, in der, unabhangig vom Signifikanztestergebnis, 
schon die Richtung der empirischen Mittelwertsdifferenz gegen die empirische 
Hypothese spricht. Die verbleibenden Falle konnen kurz wie folgt charakterisiert 
werden: 

I. Der Test ist signifikant und der empirische Effekt erreicht den Mindesteffekt: 
Die empirische Hypothese hat sich eindeutig bewahrt und kann akzeptiert 
werden. 

III. Die Daten weichen signifikant von der Nullhypothese ab, der Effekt ist aber 
kleiner als vorausgesetzt: Die EH hat sich eingeschrankt bewahrt. Wenn auch 
kleinere Effekte mit der empirischen Hypothese vertraglich sind und 
insbesondere wenn der empirische Effekt relativ dicht am angenommenen Effekt 
liegt, kann die EH akzeptiert werden. 

IV. Die Abweichung von der Nullhypothese ist nicht signifikant und kleiner als der 
angenommene Effekt: Die EH hat sich nicht bewahrt. Wenn die Teststarke 
ausreichend groB war und insbesondere wenn der empirische Effekt nahe bei 
Null liegt, kann die EH abgelehnt werden. Sie soil jedoch nicht abgelehnt 
werden, falls die Teststarke relativ niedrig oder der empirische Effekt noch von 
einer inhaltlich interessanten GroBe ist. 

Im Prinzip die gleichen Konstellationen und Entscheidungskriterien gelten auch, 
wenn die empirische Vorhersage strukturgleich mit der Alternativhypothese pi ^ (i 2 
eines zweiseitigen t-Tests ist. 
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auBer wenn bei zwei Werten zusatzlich ihre empirische Ordnung beriicksichtigt wird 
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0 Im Experiment zum Einfluss der Belohnung auf den Meinungsunterschied haben wir die 
Untersuchungssituation als Kontrollfaktor eingefuhrt (siehe Kapitel 14.3 und 16.3), weil 
die Storhypothese bestand, dass verschiedene Untersuchungssituationen die interne 
Validitat herabsetzen, wenn sie nicht kontrolliert wird. Werden in einer Untersuchung 
zwei verschiedene Situationen realisiert, entspricht die empirische Vorhersage einer 
ungerichteten Alternativhypothese Li i p, 2 ernes zweiseitigen t-Tests, bei mehr als zwei 
Situationen der Alternativhypothese eines varianzanalytischen F-Tests. 

17.1.4 Entscheidungsstrategie fur prazise Vorhersagen 

Bei der Prufung einiger empirischer Hypothesen entspricht die Struktur der 
empirischen Vorhersage der einfachen Nullhypothese eines ein- oder zweiseitigen 
Tests. Dies ist dann der Fall, wenn die Unwirksamkeit eines Faktors und damit die 
Gleichheit von Mittelwerten vorhergesagt wird, vor allem aber wenn die psycho- 
logischen Theorien und Hypothesen so prazise sind, dass genaue Auspragungen von 
Mittelwerten, genaue Haufigkeiten oder genaue Funktionsverlaufe vorhergesagt 
werden (siehe Kapitel 16.3). 

Die angenommene EffektgroBe 8 a driickt in diesem Fall aus, welche Abweichung 
von der Gleichheit noch toleriert werden soli. Sie ist damit nicht mehr als erwarteter 
Mindesteffekt zu interpretieren, sondern als Maximaleffekt und Toleranzgrenze. 

Bei den verschiedenen Ergebniskonstellationen konnen dann folgende Entschei- 
dungen iiber die zugehorige empirische Hypothese getroffen werden: 

I. Der Test ist signifikant und der empirische Effekt erreicht die angenommene 
EffektgroBe 8 a . Da sich systematische und nach den vorherigen Festlegungen 
ausreichend groBe Abweichungen von der Vorhersage ergeben haben, hat die 
EH sich eindeutig nicht bewahrt und wird abgelehnt. 

III. Der Test ist signifikant, der empirische Effekt d erreicht aber nicht die 
angenommene EffektgroBe 8 a . Da zwar tiberzufallige, aber keine hinreichend 
groBen Abweichungen von der prazisen Vorhersage vorliegen, hat die EH sich 
eingeschrdnkt bewahrt. Wenn die empirischen Abweichungen tatsachlich noch 
tolerabel erscheinen, d.h. insbesondere wenn sie erheblich unter der angenom- 
menen EffektgroBe liegen, kann die EH akzeptiert werden. 

IV. Der Test ist insignifikant und der empirische Effekt erreicht nicht die angenom- 
mene EffektgroBe. Da die Abweichung von der Vorhersage weder systematisch 
ist noch die Toleranzgrenze erreicht, hat die empirische Hypothese sich 
eindeutig bewahrt. Wenn die Teststarke ausreichend hoch gewesen ist und ins- 
besondere wenn auBerdem die empirische EffektgroBe relativ nahe bei Null 
liegt, wird die empirische Hypothese akzeptiert. 886 



886 

Eine alternative Verfahrensweise besteht darin, die Nullhypothesen, dass die Abwei- 
chungen groBer/gleich +S a bzw. kleiner/gleich -S a sind, mit zwei einseitigen Tests zu 
prtifen (Rogers, Howard & Vessey, 1993). 
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17.2 Kumulation von Fehlerwahrscheinlichkeiten 

Bei der Auswertung von empirischen Untersuchungen werden meist mehrere 
Signifikanztests durchgefiihrt und gemeinsam interpretiert. Man spricht dann von 
einer Familie von zusammengehorigen Tests. Die Wahrscheinlichkeit, dass mindes- 
tens einer dieser Tests falschlicherweise signifikant bzw. falschlicherweise insigni- 
fikant wird, ist dann in der Regel groBer als die fur jeden Test festgelegten 
Maximalwerte a bzw. (3 (Abschnitt 17.2.1). Diese sog. Kumulation von Fehlerwahr- 
scheinlichkeiten ist um so groBer, je groBer die Anzahl der Tests ist. Sie kann durch 

eine Adjustierung ausgeglichen werden, d.h. dadurch dass man a bzw. (3 fur die 

• • 

einzelnen Tests von vornherein herabsetzt (Abschnitt 17.2.2). Ublicherweise wird 
allenfalls die Kumulation der a-Fehler beachtet, d.h. das Ansteigen der Wahrschein- 
lichkeit, mindestens einen Fehler 1. Art zu begehen. 887 Beriicksichtigen wir jedoch, 
dass die Durchfuhrung von Signifikanztests dazu dient, Entscheidungen tiber das 
Zutreffen psychologischer und empirischer Hypothesen zu treffen, ist haufig die 
Kumulation der (3-Fehler viel schwerwiegender (Kapitel 17.2.4 und 17.2.5). 

17.2.1 AusmaB der Fehlerkumulation 

Bei einem Signifikanztest ist die Wahrscheinlichkeit, einen Fehler 1. Art zu begehen, 
(hochstens) gleich dem gewahlten Signifikanzniveau a. Die Wahrscheinlichkeit, eine 
zutreffende Nullhypothese richtigerweise nicht abzulehnen, betragt demnach 1-a. 
Flihren wir zwei voneinander unabhangige Tests mit den Signifikanzniveaus cxi und 
a 2 durch und sind fur beide Tests die Nullhypothesen zutreffend, ist die Wahr- 
scheinlichkeit, beide Nullhypothesen zu Recht nicht abzulehnen, gleich dem Produkt 
(l-a 1 )(l-a 2 ), bei a = 0,05 also gleich 0,9025. 889 Das komplementare Ereignis 
besteht darin, mindestens eine der beiden Nullhypothesen falschlicherweise abzuleh- 
nen, also mindestens einen Fehler 1. Art zu begehen. Die Wahrscheinlichkeit dafiir 
betragt logischerweise l-(l-a 1 )(l-a 2 ) , bei a = 0,05 also 0,0975. Bei zwei unab- 
hangigen Signifikanztests ist das Risiko, mindestens einen Fehler 1 . Art zu begehen, 
also schon von 5% auf fast 10% angestiegen. 

Kumulation von a-Fehlern 

Allgemein ergibt sich fur m unabhangige Tests die Wahrscheinlichkeit, dass die 
Anzahl der Fehler 1. Art tiber Null liegt, kurz: P(F1) , wie folgt: 890 : 



z.B. Games (1971), Miller (1981), Hays (1994), Keselman, Cribbie & Holland (1999) 

888 Westermann (1983b), Westermann & Hager (1983a, 1986) 

889 nach dem Multiplikationssatz fur Wahrscheinlichkeiten (Bortz, 1999, S. 55-56, 260-262, 
Hays, 1994, S. 340-342) 

890 Die nach dem Produktzeichen n stehenden Faktoren werden alle miteinander multi- 
pliziert. Sind alle 0 Cj gleich, vereinfacht sich (17-2) zu 1 - (1 - a) m . 
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(17-2) P(Fl) = l-(l-a 1 )...(l-a m ) = l-n(l-«i)- 

i=l 

Bei m= 3 Tests mit a = 0,05 betragt diese Wahrscheinlichkeit 0,143, bei 5 Tests 
0,226, bei 10 Tests 0,401 und bei 100 Tests 0,994. 

Sind die Tests einer Familie nicht unabhangig, kann die Wahrscheinlichkeit fiir 
mindestens einen Fehler 1. Art nicht genau berechnet werden. Es gibt aber eine 
Obergrenze fur diese Wahrscheinlichkeit, die als Bonferroni-Ungleichung bekannt 
ist: 891 

m 

(17-3) P(F1) < . 

i=l 

Fiir kleine Testfamilien liegt diese allgemeine Obergrenze nur relativ wenig liber 
dem aus (17-2) zu berechnenden Wert fiir unabhangige Tests. Sind die Signifikanz- 
niveaus 0Cj alle gleich a, vereinfacht sich (17-3) zu 

(17-4) P(F1) < ma . 

Kumulation von fi-Fehlern 

Da die Fehler 1. und 2. Art in ahnlicher Weise definiert sind, konnen die Formeln fiir 
die Kumulation der a-Fehler unmittelbar auf die Kumulation der (3-Fehler iibertragen 
werden. So gilt fiir die Wahrscheinlichkeit mindestens eines Fehlers 2. Art in m 
Tests mit gleichen (3-Werten: 

(17-5) P(F2) < m(3 . 



17.2.2 Adjustierung von Fehlerwahrscheinlichkeiten 

Um die Kumulation der a-Wahrscheinlichkeiten auszugleichen, kann man das 
Signifikanzniveau a der einzelnen Tests so herabsetzen, dass P(F1), die 
Wahrscheinlichkeit mindestens eines Fehlers 1. Art in der Testfamilie nicht groBer 
als ein bestimmtes familienbezo genes Signifikanzniveau a F wird. Die Festlegung von 
a F kann sich an den Konventionen fiir Einzeltests orientieren. Danach wird in der 
Regel a F = 0,05 gesetzt, aus inhaltlichen Griinden kann aber auch ein groBerer Wert 
tolerabel sein. Das Signifikanzniveau a fiir die einzelnen Tests ergibt sich durch die 

8Q9 

Bonferroni- Adjustierung, die aus der Umkehrung von (17-3) und (17-4) resultiert: 



(17-6) 



cx F 
a = ^- 

m 



Hays (1994, S. 341-342), Miller (1981, S. 8-9) 

sog. Bonferroni- oder Dunn-Tests, zu Modifikationen siehe Shaffer (1995) 
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Ein kleineres Signifikanzniveau a fur die einzelnen Tests fiihrt unter sonst gleichen 
Bedingungen zu einer Erhohung ihrer (3-Wahrscheinlichkeiten. Will man jedoch trotz 
einer Adjustierung von a die (3-Werte und damit auch die Teststarken fur die 
einzelnen Tests konstant halten, muss man die Zahl der Untersuchungsfalle erhohen. 

Auch die Kumulation der (3-Wahrscheinlichkeiten konnen wir durch eine 
Bonferroni- Adjustierung ausgleichen. Wir setzen dazu eine Obergrenze (3 F ftir die 
Wahrscheinlichkeit mindestens eines Fehlers 2. Art in der Familie von m Tests fest, 
und zwar wiederum orientiert an den Konventionen ftir Einzeltests (z.B. (3 = 0,05 
oder 0,20). Die Fallzahl der Tests wird so geplant, dass fur sie jeweils 

(17-7) B = — 

m 

gilt, d.h. dass sie jeweils mindestens eine Teststarke von l-(3 = l-(3 F /m haben. Bei 
einer konstanten angenommenen EffektgroBe erfordert diese Verringerung von (3 
eine Erhohung der Fallzahlen. 

Spezifikation der Testfamilie ftir die Adjustierung 

Je groBer die Anzahl m der Tests ist, desto starker werden die Fehlerwahr- 
scheinlichkeiten a und (3 durch eine Adjustierung reduziert und desto mehr Falle 
benotigt man, um eine bestimmte angenommene EffektgroBe mit der Teststarke 
1 - (3 entdecken zu konnen. Die Familie von Tests, hinsichtlich der die 
Adjustierungen erfolgen, sollte deshalb nicht groBer sein als unbedingt notwendig. 

In der Fachliteratur finden sich sehr unterschiedliche methodische Kriterien ftir 
die Frage, wann verschiedene Tests zu einer Familie zusammengefasst und 
Adjustierungen der a- Wahrscheinlichkeit durchgeflihrt werden sollen. Da das Ziel 
jeder signifikanzstatistischen Datenauswertung darin besteht, empirische Hypothesen 
zu priifen, ist es sinnvoll, ein inhaltliches Kriterium zu nehmen: Mehrere statistische 
Tests sind genau dann als eine Familie zu betrachten, wenn ihre Ergebnisse 
zusammengefasst werden sollen, um eine einzige empirische Hypothese zu priifen. 

Adjustierung von a oder 
• • 

Ublicherweise wird nur die Kumulation der a-Fehler beriicksichtigt und nur die a- 
Adjustierung empfohlen. Die Kumulation der (3-Fehler bleibt meist unbeachtet. Um 
die Validitat der Priifung einer empirischen Hypothese zu sichern, ist es meist nicht 
erforderlich, sowohl die a- wie die (3-Kumulation zu kontrollieren. Vielmehr geniigt 



893 

Manche Autoren raten nur dann zu einer a-Adjustierung, wenn statt eines globalen 
Tests mehrere Kontraste durchgefuhrt werden. Andere empfehlen, alle Tests eines 
Experiments zu einer Familie zusammenzufassen ( experimentwise error rate). Diese 
Kriterien sind unbefriedigend, weil sie an methodischen Merkmalen orientiert sind, die 
mitunter durch relativ periphere Umstande bestimmt werden (verfiigbare Personen, 
kontrollierten Storvariablen usw.). 
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es, jeweils eine dieser beiden Wahrscheinlichkeiten zu adjustieren. Ob dabei die 
Kumulation der a- oder die Kumulation der (3-Fehler ausgeglichen werden muss, 
hangt von der Struktur der empirischen Vorhersage ab. Dies soil an typischen 
Beispielen erlautert werden. Im folgenden Unterkapitel 17.2.3 wird der Fall 
ausfuhrlich beschrieben, dass die Vorhersage auf eine Konjunktion von Alternativ- 
hypothesen abgebildet werden kann. Die anderen Falle werden in den weiteren 
Unterkapiteln sehr viel ktirzer behandelt. 

17.2.3 Adjustierung bei Konjunktionen von Alternativhypothesen 

Aus vielen psychologischen Hypothesen ergeben sich empirische Vorhersagen, die 
strukturgleich mit einer logischen Konjunktion (Und-Verbindung) von mehreren 
statistischen Alternativhypothesen sind: Die empirische Hypothese wird nur dann 
akzeptiert, wenn alle Alternativhypothesen akzeptiert worden sind. 894 

0 Bei Vorhersagen iiber die GroBenordnung von Mittelwerten (z.B. y l > y 2 > y 3 > y 4 ) 
kann man paarweise gerichtete Kontraste durchfiihren, z.B. t-Tests gegen die Alternativ- 
hypothesen pi > g 2 > M 2 > M3 und p 3 > p 4 (siehe oben Kapitel 16.4). Legt man ein strenges 
Entscheidungskriterium zugrunde, wird die empirische Hypothese nur dann akzeptiert, 
wenn alle Alternativhypothesen akzeptiert worden sind. 

Unterstellen wir zunachst, dass die empirische Hypothese zutreffend ist und dass 
deshalb auch alle m Alternativhypothesen zutreffen. Tritt in mindestens einem der 
drei Test ein Fehler zweiter Art auf, wird die entsprechende Alternativhypothese 
nicht akzeptiert und die empirische Hypothese falschlicherweise als nicht bewahrt 
bezeichnet. Die Kumulation der (3-Fehler erhoht hier also die Wahrscheinlichkeit f 
fiir falschliche Ablehnungen der empirischen Hypothese. Um diese Beeintrachtigung 
der Validitat der empirischen Hypothesenprlifung auszugleichen, sollten in diesem 
Fall die (3- Wahrscheinlichkeiten der drei Tests gemaB (17-7) adjustiert werden. 
Damit wird der familienbezogene (3-Wert bei (3 F = 0,05 gehalten. 

Ist hingegen die empirische Hypothese unzutreffend und treffen alle Null- 
hypothesen zu, ergibt sich eine falsche Entscheidung iiber die empirische Hypothese 
nur, falls in alien Tests ein Fehler 1. Art auftritt. Die Wahrscheinlichkeit dafiir ist 
aber nie groBer als a, sondern meist betrachtlich kleiner, bei m unabhangigen Tests 
ist sie sogar nur gleich a m . Die Kumulation von a- Wahrscheinlichkeiten ftihrt in 
diesem Fall also nicht zu einer Erhohung des Risikos fur Fehlentscheidungen iiber 
die empirische Hypothese, sie muss nicht durch Adjustierung kontrolliert werden. Im 
Gegenteil ware es sachlich sogar gerechtfertigt, mit betrachtlich groBeren a-Werten 
als dem konventionellen 0,05 zu arbeiten. 



894 Gegeniiber den im Kapitel 17.1 beschriebenen Entscheidungsstrategien unterstellen wir 
hier und im Folgenden der Einfachheit halber, dass der Ausgang der statistischen 
Hypothesenpriifung unmittelbar die Entscheidung iiber die empirische Hypothese 
bestimmt, d.h. die empirische EffektgroBe stets im entsprechenden Bereich liegt. 
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Diese Argumente fur eine (3- und gegen die a-Adjustierung gelten fur alle empiri- 
schen Vorhersagen, die strukturgleich zu einer Konjunktion von Alternativ- 
hypothesen sind. 

0 Im Experiment von Frey und Irle ergibt sich eine empirische Vorhersage, die 

895 

strukturgleich zu einer Konjunktion von zwei Alternativhypothesen ist: 

(16-14) [Pll<Pl 2 ]A[p 21 >P22]- 

0 In einer anderen Untersuchung zum Zusammenhang zwischen der Belohnungshohe fur 
ein einstellungskontrares Aufsatzschreiben und der anschlieBenden Meinungsauspragung 
wird der dissonanztheoretisch vorhergesagte Mittelwertsunterschied bei niedriger und 
hoher Belohnung (y u < y 2i ) fur drei Verfahren zur Erfassung der Meinung (abhangige 
Variablen Y a , Y b und Y c ) vorhergesagt und tiberpriift. Die empirische Vorhersage ist 
strukturgleich mit folgender Konjunktion von drei Alternativhypothesen: 

(17-8) [p la < p 2a ] A[p lb < p 2b ] A[p lc < p 2c ]. 

In jedem Fall kann die Konjunktion von J Alternativhypothesen durch J-l 
einseitige t-Tests gepriift werden. 896 Eine a-Adjustierung ist dann nicht notwendig, 
da die empirische Hypothese nur dann akzeptiert wird, wenn alle Tests signifikant 
sind. Durch eine Adjustierung von (3 hingegen kann das Risiko klein gehalten 
werden, dass die empirische Hypothese wegen eines falschlich nichtsignifikanten 
Tests falschlicherweise als nicht zutreffend abgelehnt wird. 

17.2.4 Adjustierung bei Disjunktionen von Alternativhypothesen 

Prinzipiell kann die empirische Vorhersage auch einer Disjunktion von Alternativ- 
hypothesen entsprechen, beispielsweise bei einer wohlwollenden Priifung der 
empirischen Hypothese: Die empirische Hypothese wird dann akzeptiert, wenn 
mindestens eine der gepruften Nullhypothesen abgelehnt wurde. 

6 In der dissonanztheoretischen Untersuchung konnte man die empirische Hypothese auch 
bereits dann als zutreffend akzeptieren, wenn die entsprechende Nullhypothese fur einen 
einzigen der drei Indikatoren fur eine Meinung abgelehnt wird, das heiBt wenn die 
folgende disjunktive Aussage akzeptiert wird 

(17-9) [|Ll la < |Ll 2a ] V [|l lb < |Ll 2b ] V [|l lc < |H 2c ]. 

Ist die empirische Hypothese unzutreffend und sind alle Nullhypothesen zutreffend, 
ftihrt in diesem Fall schon ein zufallig signifikantes Ergebnis zu einer falschlichen 
Akzeptierung der empirischen Hypothese. Deshalb muss hier die Kumulation der a- 

895 siehe oben Seite 412 

896 Bei der Priifung von (17-8) kann als globaler (Overall-)Test ein multivariater 
Mittelwertstest (multivariate Varianzanalyse oder multivariater T-Test, siehe Bortz, 
1999, Kapitel 17) vorgeschaltet werden. Mit ihm wird die Unterschiedlichkeit der 
Gruppen auf alien abhangigen Variablen simultan gepriift. 
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Fehler durch Adjustierung kontrolliert werden. Eine Kumulation von (3-Fehlern 
hingegen muss nicht ausgeglichen werden. 97 

Herausgreifen von signifikanten Zusammenhangen 

In empirischen Arbeiten, die eher explorativ sind und nicht auf die gezielte Priifung 
theoretisch begriindeter Erwartungen zielen, werden haufig groBere Mengen von 
Variablenzusammenhangen untersucht und dann diejenigen betrachtet, die 
signifikant geworden sind. Dies entspricht einer empirischen Vorhersage, die 
strukturgleich mit eine Disjunktion von Alternativhypothesen ist. 

0 In einer organisationspsychologischen Untersuchung werden die Korrelationen zwischen 
12 Indikatoren der Arbeitszufriedenheit und 20 moglichen Stressoren berechnet. Es wird 
vermutet, dass einige Stressoren mit einigen Zufriedenheitsvariablen assoziiert sind. Jede 
dieser 240 Korrelationen wird mit einem t-Test auf Signifikanz gepriift. Die signifikanten 
Korrelationen werden als wesentliche Zusammenhange zwischen Stress und Gesundheit 
herausgegriffen und interpretiert. 

Haufig ergibt sich dabei nur eine relativ kleine Zahl an signifikanten Ergebnissen. 
Werden nur diese wenigen signifikanten Unterschiede oder Zusammenhange 
herausgegriffen und interpretiert, geht man ein erhohtes Risiko ein, dass diese Tests 
nur zufallig signifikant geworden sind. Damit ist das Risiko erhoht, falsche 
Aussagen tiber Variablenzusammenhange zu treffen. 

Man kann das Risiko natiirlich durch eine a-Adjustierung vermindern. Bei einer 
sehr groBen Zahl an Tests sinkt die Teststarke dann aber leicht so weit ab, dass kaum 
mehr eine Chance besteht, bestehende Zusammenhange als signifikant zu entdecken. 

Die Uberlegungen zur Fehlerkumulation und -adjustierung sind also nicht nur fur 
den Fall relevant, dass empirische Vorhersagen und statistische Hypothesen explizit 
aufgestellt und experimentell iiberpruft werden. Vielmehr kann ein Ignorieren der 
Kumulation von Fehlerwahrscheinlichkeiten auch in eher deskriptiven und korrela- 
tiven Untersuchungen das Risiko erhohen, aus den Ergebnissen falsche inhaltliche 
Schliisse zu ziehen. 

Vermeiden kann man diese Schwierigkeiten zum einen dadurch, dass man 
aufgrund theoretischer oder inhaltlicher Voruberlegungen die Anzahl der Variablen 
und Tests betrachtlich reduziert. Zum anderen kann man eine Interpretation von 
Variablenzusammenhangen davon abhangig machen, ob sie sich auch in einer 
unabhangigen Untersuchungsgruppe zeigen ( Kreuzvalidierung ) oder ob sie in 
systematischen Unterteilungen der Untersuchungsgruppe (z.B. in Manner und 
Frauen, Studenten und Angestellte usw.) stabil bleiben. 



897 

Sind alle Alternativhypothesen zutreffend, wird die empirische Hypothese nur dann 
falschlicherweise abgelehnt, wenn alle Tests falschlicherweise nicht- signifikant sind. 
Die Wahrscheinlichkeit daflir ist nie groBer als (3 (vgl. die auf a bezogene 
Argumentation im vorigen Kapitel 17.2.3). 
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17.2.5 Adjustierung bei Verknupfungen von Nullhypothesen 

Empirische Vorhersagen konnen strukturgleich mit Konjunktionen von Nullhypo- 
thesen sein. 

0 Es wird untersucht, ob der Zusammenhang zwischen Belohnung und Meinungs- 
unterschied unbeeinflusst von Situationen und Personen ist. Dazu werden neben der UV 
A (Belohnungshohe) drei Kontrollfaktoren eingefuhrt: Untersuchungsraum (B: Luxus- 
hotel, Institutskeller, Schulklasse), Untersuchungspersonen (C: Gymnasiasten, Lehrlinge, 
Gefangnisinsassen) und Untersuchungsleiter (D: Studenten, Professoren). Die empirische 
Hypothese der Stabilitat des dissonanztheoretischen Belohnungseffektes wird akzeptiert, 

wenn die Belohnungshohe A mit keiner drei anderen Variablen interagiert, d.h. wenn die 

898 

Interaktionstests A x B, A x C und A x D insignifikant bleiben. 

Da schon ein falschlicherweise signifikantes Ergebnis zu einer falschen 
Entscheidung liber die empirische Hypothese flihrt, muss hier a adjustiert werden, 
die (3-Kumulation muss dagegen nicht kontrolliert werden. 899 

Wenn die empirische Hypothese schon akzeptiert wird, falls eine von mehreren 
Nullhypothesen akzeptiert wird, ist die empirische Vorhersage strukturgleich mit 
einer Disjunktion von Nullhypothesen. Es ist nicht a, sondern (3 zu adjustieren. 

Konjunktionen von Null- und Alternativhypothesen 

Relativ haufig sind empirische Vorhersagen strukturgleich mit einer Konjunktion 
von K Null- und J Alternativhypothesen. 

0 Um zu prtifen, ob hyperaktives Verhalten durch variable Verstarkung antagonistischen 
Verhaltens dauerhaft reduziert wird, werden Behandlungs- und Kontrollgruppe (Faktor 
A) fur unterschiedliche Verstarkungsplane (Faktor B) verglichen. Eine Reduktion wird 
fur variable Intervall- (Bi) und Quotenverstarkung (B 2 ) erwartet, aber nicht bei 
konstanter oder kontinuierlicher Verstarkung (B 3 bis B 5 ). Die empirische Hypothese wird 
akzeptiert, wenn folgende konjunktive Aussage akzeptiert wird 

(17—10) [ M'l 1 < M-12 1 A [ 0 2 1 <1^22 1 A t M-31 = 1-^32 1 A 1 H-41 = O42 l'*' I Os 1 ~ M-52 ]• 

Die empirische Hypothese wird falschlicherweise abgelehnt, wenn mindestens ein 
Fehler 2. Art in den ersten K oder mindestens ein Fehler 1. Art in den letzten J Tests 
auftritt. Deshalb miissen wir die (3-Werte der ersten K und die a-Werte der letzten J 
Tests adjustieren, indem wir sie auf jeweils 0,05/(K+J) setzen. Die a-Werte der 
ersten K und die (3-Werte der letzten J Tests miissen nicht adjustiert werden. 



898 Adaquate EffektgroBen, Validitaten und Teststarken werden weiterhin vorausgesetzt. 

899 In Statistikbiichern (z.B. Bortz, 1999, S. 260-261) wird die Notwendigkeit der a- 
Adjustierung gern fur folgenden Fall erlautert: Statt eines varianzanalytischen F- werden 
mehrere t-Tests durchgefiihrt und die globale Nullhypothese wird abgelehnt, falls einer 
der t-Tests signifikant wird. Diese spezielle Situation entspricht einer Konjunktion von 
Nullhypothesen und es ist tatsachlich eine a- Adjustierung sinnvoll. 





18 Identifikation von Moderatorvariablen 



Eines der bekanntesten methodischen Konzepte in der Psychologie ist die externe 
Validitat. Nach der klassischen Konzeption von Campbell und Stanley aus dem Jahr 
1963 betrifft sie die Frage, inwieweit sich ein in einer bestimmten Untersuchung auf- 
gezeigter kausaler Zusammenhang auf andere Personen, Situationen und Zeitpunkte 
verallgemeinern lasst. Die externe Validitat einer Untersuchung ist um so hoher, je 
besser die Untersuchungsergebnisse auf andere Falle verallgemeinert werden 
konnen. 

Die Bedeutung der externen Validitat einer Untersuchung wird jedoch haufig 

falsch eingeschatzt. Insbesondere wird tibersehen, dass die externe Validitat, anders 

als die interne Validitat, keineswegs ein Merkmal fiir die Qualitat einer einzelnen 

Untersuchung ist. Inwieweit ein Ergebnis generalisiert werden kann, hangt nicht so 

sehr von Merkmalen der Untersuchung ab, sondern viel mehr von den empirischen 

Gegebenheiten im jeweiligen Gegenstandsbereich und den Intentionen der Wissen- 

schaftler. Auf welche Falle soil das Ergebnis tibertragen werden und wie stabil ist 

das Ergebnis bei veranderten Bedingungen? Deshalb ist es wichtig, durch theoreti- 
• • 

sche Uberlegungen und empirische Untersuchungen diejenigen Moderatorvariablen 
zu identifizieren, von denen die Generalisierungsmoglichkeiten begrenzt werden. 
Um dies zu erlautern, wird zunachst das Konzept der externen Validitat etwas naher 
betrachtet. 



18.1 Externe Validitat 

Jede Untersuchung findet unter einer bestimmten Konstellation von Personen, 
Situationen und Zeitpunkten statt. Generalisierungen von Untersuchungsergebnissen 
auf eine andere, noch nicht untersuchte Konstellation sind induktive Argumente 
(siehe oben Kapitel 4.2). Wenn in einem untersuchten Anwendungsfall ein bestimm- 
ter Variablenzusammenhang besteht, folgt daraus nicht logisch zwingend die 
Aussage, dass dieser Zusammenhang auch in einem anderen Anwendungsfall gilt. 
Die Annahme eines Variablenzusammenhangs im zweiten Anwendungsfall kann 
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Campbell & Stanley (1963), Cook & Campbell (1979, S. 70-80) 
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aber (in mehr oder minder starkem MaBe) durch das Ergebnis der ersten Unter- 
suchung gestlitzt werden. 

Konkret handelt es sich bei jeder Generalisierung eines untersuchten Zusammen- 

hangs auf einen nicht untersuchten Fall um die spezielle Form eines induktiven 

Arguments, die wir als empirische Vermutung charakterisiert haben. Die Berech- 

tigung einer Generalisierung eines empirischen Ergebnisses hangt deshalb nach den 

Ergebnissen des Kapitels 4.3.2 von der Anzahl der vorliegenden positiven Beobach- 

tungen, von ihrer Unterschiedlichkeit und von ihrer (internen) Validitat ab, vor allem 

• • 

aber von der Ahnlichkeit zwischen der untersuchten und der interessierenden, aber 
noch nicht untersuchten Bedingungskonstellation. Ob die Generalisierung eines 
Variablenzusammenhangs auf neue Anwendungsfalle zu tatsachlich zutreffenden 
Aussagen fiihrt, hangt auch ganz wesentlich von den Verhaltnissen im konkreten 
Gegenstandsbereich ab, das heiBt inwieweit die Variablenbeziehungen tiber ver- 
schiedene Randbedingungen stabil bleiben oder sich verandern. 

Insgesamt hangt das AusmaB der externen Validitat einer Untersuchung damit 
eindeutig nicht nur von den methodischen Eigenschaften der Untersuchung selbst ab, 
sondern auch von empirischen RegelmaBigkeiten im betrachteten Phanomenbereich 
und den intendierten Anwendungen, auf die generalisiert werden soil. 

Die Definition der Validitat einer Untersuchung, die wir im Kapitel 13.1 beschrie- 
ben haben, beriicksichtigt diesen Sachverhalt, indem sie die sog. externe Validitat 
nicht mit einschlieBt. Die Validitat einer Untersuchung beruht ausschlieBlich auf den 
Wahrscheinlichkeiten fiir Entscheidungen liber die Geltung einer bestimmten Theo- 
rie im untersuchten Anwendungsfall. Sie ist damit per definitionem nicht von der 
Generalisierbarkeit der Ergebnisse abhangig. 

Damit ist jedoch nicht gesagt, dass die als externe Validitat bezeichnete Generali- 
sierbarkeit von Befunden fiir uns irrelevant ist. Sie soil lediglich deutlich von der 
methodischen Giite einer Untersuchung separiert werden. Die Generalisierbarkeit 
von Ergebnissen ist keine Eigenschaft einer einzelnen Untersuchung mit einer 
einzelnen empirischen Hypothese, sondern sie ist ein Merkmal einer ganzen Menge 
intendierter Anwendungen. 

Hat sich eine substanzwissenschaftliche Hypothese in einer bestimmten Unter- 
suchung bewahrt, so ist der gefundene theoriekonforme Variablenzusammenhang 
genau dann auf alle anderen intendieren Anwendungen zu generalisieren, wenn das 
zugrunde liegende Theorie-Element auch in alien diesen Fallen erfolgreich anwend- 
bar ist. Ob dies der Fall ist, kann nicht durch Bewertung der Giite einer einzelnen 

Untersuchung beurteilt werden, sondern nur durch empirische Untersuchungen oder 

• • 

inhaltlich-theoretische Uberlegungen. 

Da wir standig vor der Frage stehen, inwieweit wir die Ergebnisse vorliegender 
empirischer Hypothesenprlifungen auf andere interessierende Situationen und Perso- 
nen ubertragen konnen, besteht eine der Hauptaufgaben wissenschaftlicher For- 
schung darin, den Bereich der erfolgreichen Anwendbarkeit der Theorien und 
Theorie-Elemente so genau wie moglich abzugrenzen. Dazu miissen die Merkmale 
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von Personen und Situationen identifiziert werden, durch die sich die erfolgreichen 
und nicht-erfolgreichen Anwendungsbereiche unterscheiden. Diese differenzieren- 
den Merkmale werden als Moderatorvariablen bezeichnet. 



18.2 Personale und situationale Moderatorvariablen 

Die Elemente der Menge der intendierten Anwendungen eines Theorie-Elements 
beziehen sich auf verschiedene Personen und auf unterschiedliche Situationen. Wenn 
die erfolgreiche Anwendbarkeit dieser Theorieversion von einem Merkmal der Un- 
tersuchungssituation bzw. von einem Merkmal der untersuchten Personen abhangt, 
liegt eine situationale bzw. eine personale Moderatorvariable vor. 

Wir haben gesehen, dass in jeder empirischen Untersuchung die empirische 
Hypothese geprlift wird, dass die zugrunde gelegte Theorieversion in dem jeweils 

QO 1 

betrachteten Anwendungsfall Geltung hat. Uberpriift wird insbesondere, ob die 
theoretisch angenommene Wirkung einer unabhangigen Variablen U auf eine abhan- 
gige Variable V in dieser Bedingungskonstellation gilt. 

Eine Variable P, die ein Merkmal der untersuchten Personen bezeichnet, ist eine 
personale Moderatorvariable, wenn die empirische Hypothese unter mindestens einer 
Auspragung von P gliltig ist, unter mindestens einer anderen Auspragung aber nicht. 
Varianzanalytisch betrachtet besteht dann eine Interaktion zwischen der Personen- 
variable P und der unabhangigen Variablen U. Eine situationale Moderatorvariable 
liegt entsprechend dann vor, wenn die Gultigkeit der empirischen Hypothese von 
einer Eigenschaft S der Untersuchungssituation abhangt, d.h. wenn die unabhangige 
Variable U mit S interagiert. 



18.3 Moderatorvariablen zwischen und innerhalb von Untersuchungen 

Je nach Art der Merkmalsvariation gibt es Moderatorvariablen innerhalb von 
Anwendungen und zwischen Anwendungen. 

Erstens kann die (mogliche) Moderatorvariable ein Merkmal bezeichnen, das 
innerhalb der Untersuchung variiert: Unterschiede zwischen den Personen, die unter- 
sucht werden, oder Unterschiede zwischen den Bedingungen, unter denen diese 
Personen untersucht werden. Das Gesamtergebnis der Untersuchung findet sich in 
diesem Fall nicht in alien Untergruppen und -bedingungen wieder. Die Zahl von 
moglichen Moderatorvariablen dieser Art ist stets unendlich groB. Inwieweit der 
Geltungsbereich einer Hypothese tatsachlich durch bestimmte Variablen abgegrenzt 
wird, kann empirisch uberpriift werden, indem vermutete Moderatorvariablen als 
Kontrollfaktoren eingefuhrt werden (vgl. Kapitel 14.4). Praktisch ist dies allenfalls 
fur einige wenige Personen- oder Situationsmerkmale zu realisieren. 
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siehe oben Kapitel 11.7.3 und 12.3.2.4 
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0 Fur das Experiment von Frey und Irle bezeichne M das politische Engagement der unter- 
suchten Schuler. Fur jeden Schuler sei bekannt, ob er Mitglied einer politischen Gruppe 
ist (Mi) oder nicht (M 2 ). Nehmen wir an, die vorhergesagte negative Meinung bei gerin- 
gerer Belohnung zeige sich nur fur die Untergruppe der politisch nicht engagierten 
Schuler, wahrend sich die Mittelwerte in der Gruppe der engagierten Schuler nicht 
bedeutsam unterscheiden. M ist in diesem (fiktiven) Fall eine personale Moderator- 
variable, weil die dissonanztheoretische Hypothese fur eine Auspragung zutreffend ist, 
fur die andere aber nicht. 

0 Nehmen wir an, dass die Untersuchungen von einem alteren und einem jtingeren Ver- 
suchsleiter durchgefiihrt worden sind. Wenn die vorhergesagte negativere Meinung bei 
geringerer Belohnung sich bei dem alteren Versuchsleitern zeigen wiirde, nicht aber bei 
dem jungeren, ware die Variable “Versuchsleiter” eine situationale Moderatorvariable. 

Zweitens kann die mogliche Moderatorvariable ein Merkmal oder ein Merkmals- 
biindel bezeichnen, das zwischen verschiedenen intendierten Anwendungen variiert. 
Eine tatsachliche Moderatorvariable liegt vor, wenn die empirische Hypothese flir 
Anwendungen mit bestimmten Merkmalsauspragungen gliltig ist, flir andere aber 
nicht. 

0 Nehmen wir (wiederum fiktiv) an, das Experiment von Frey und Irle sei mehrfach mit 
unterschiedlichen Personen an unterschiedlichen Orten repliziert worden. Bei einer 
Zusammenstellung der Ergebnisse zeige sich, dass die dissonanztheoretische Vorhersage 
sich immer bestatigt hat, wenn Gymnasiasten und Studenten als Probanden fungierten, 
nicht aber bei Haupt- und Berufsschiilern. Eine Variable “Bildungsgrad” mit den Aus- 
pragungen “Gymnasium oder Studium” und “Haupt- oder Berufsschule” ware dann eine 
personale Moderatorvariable. 

Analogstudien 

Besonders wichtig ist die Frage nach Moderatorvariablen bei Analogstudien. Das 
sind Untersuchungen, in denen die Anwendbarkeit eines Theorie-Elements an einer 
Personengruppe uberpruft wird, auf die das Element eigentlich gar nicht angewendet 
werden soil. 

0 Die Wirkungen psychotherapeutischer Verfahren werden haufig nicht an klinischen Pati- 
enten untersucht, sondern es werden Studenten oder nur leicht beeintrachtigte Personen 
betrachtet, da diese einfacher zuganglich sind. 

0 Im dissonanztheoretischen Teilnetz zur Wirkung einstellungskontraren Verhaltens sei ein 
spezielles Theorie-Element zur Forderung der Arbeitszufriedenheit durch einstellungs- 
kontrares Verhalten formuliert. Danach nimmt die Unzufriedenheit von Arbeitnehmern 
ab, wenn wir sie dazu veranlassen konnen, regelmaBig gegen eine kleine Belohnung zu 
Hause und in ihrem Bekanntenkreis die angeblich hervorragenden Arbeitsbedingungen in 
ihrem Betrieb zu loben. Da sich keine Betriebe und Arbeitnehmer finden, an denen die 
erfolgreiche Anwendbarkeit dieses Theorie-Elements empirisch uberpruft werden kann, 
wird ein analoges Experiment mit Studenten durchgefiihrt, die die Studienbedingungen 
an ihrer Universitat loben sollen. 
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Ein vorhergesagter Zusammenhang kann also in der untersuchten Personengruppe 
(im Mittel) vorliegen, in der eigentlich interessierenden Personengruppe aber nicht 
(und umgekehrt). Durch die Untersuchung einer Personengruppe, die nicht zum 
intendierten Anwendungsbereich gehort, wird deshalb die Wahrscheinlichkeit fur 
Fehlentscheidungen iiber die empirische Giiltigkeit des interessierendes Theorie- 
Elements erhoht. 

Eine entsprechende situationale Moderatorvariable kann auftreten, wenn eine 
Hypothese unter Bedingungen geprtift wird, auf die sich eigentlich gar nicht bezieht. 

0 Wird das (fiktive) dissonanztheoretische Element zur Arbeitszufriedenheit an Arbeit- 
nehmern uberpriift, die in einem kleinen Vortrag im Rahmen einer Schulungsveranstal- 
tung die Arbeitsbedingungen loben sollen, liegt eine situationale Moderatorvariable vor, 
wenn die empirische Hypothese nur bei freiwilligen und offentlichen Bekundungen gilt. 

Dieser Typ von Moderatoreffekten flihrt unmittelbar zu der haufig gestellten und 
diskutieren Frage, ob es sinnvoll ist, wissenschaftliche Untersuchungen in kiinst- 
lichen, experimentell kontrollierten Situationen durchzuftihren, wo “eigentlich” doch 
das Verhalten und Erleben der Menschen unter ihren iiblichen, alltaglichen Bedin- 
gungen zu beschreiben und zu erklaren ist. 



18.4 Laborexperimente versus Feldstudien 

Wissenschaftliche Untersuchungen aus der Psychologie werden immer wieder 
dahingehend kritisiert, dass sie isolierte und einfache Verhaltensweisen von gezielt 
ausgewahlten Personen (vor allem Studenten der Psychologie) in kiinstlich kontrol- 
lierten Situationen registrieren. 

Nachdem die erwahnte Arbeit von Campbell und Stanley allgemein bekannt 
geworden ist, wird diese Kritik an der psychologischen und insbesondere der expe- 
rimentalpsychologischen Forschung vorzugsweise dadurch artikuliert, dass man auf 
die mangelnde externe Validitat psychologischer Experimente hinweist, d.h. die 
geringe Generalisierbarkeit ihrer Ergebnisse auf andere, natlirlichere Situationen und 
andere, zum Beispiel nicht-studentische Personen. 

Dabei wird allerdings tibersehen, dass die Arbeiten zur externen Validitat sich 
speziell auf Forschungsuntersuchungen beziehen, die stark anwendungsorientierte 
Fragestellungen beantworten sollen, d.h. beispielsweise die Effektivitat verschie- 
dener Lehrmethoden vergleichen oder die Abhangigkeit dieser Effektivitat von Per- 
sonlichkeitsmerkmalen der Schuler untersuchen wollen . 902 In diesem anwendungs- 
bezogenen Zusammenhang ist es tatsachlich sehr wichtig, ob eine im Labor an einer 
bestimmten Probandengruppe bewahrte Theorie sich auch in der tatsachlich interes- 
sierenden Schulsituation bewahren kann (oder umgekehrt). 
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Grundlagenwissenschaftliche Experimente dagegen werden nicht durchgefiihrt, 
um Informationen iiber “natlirliche” Populationen und Situationen zu gewinnen. Sie 
dienen vielmehr dazu, kausale Hypothesen und Theorien zu uberpriifen. Wie wir im 
Kapitel 7.2.4 gesehen haben, beinhalten kausale Theorien (implizit) Ceteris-paribus- 
Bedingungen. Sie beziehen sich also auf Situationen, die insofern kiinstlich sind, als 
auBer den explizit auf ihre Wirkung hin untersuchten Variablen alle anderen Bedin- 
gungen gleich oder gleichverteilt sein mtissen. In natlirlich auftretenden Situationen 
ist eine ausreichend valide empirische Priifung von Kausalhypothesen in der Regel 
nicht moglich, weil diese Ceteris-paribus-Bedingungen noch nicht einmal anna- 
herungsweise erflillt werden konnen. Zur validen Priifung von Kausalhypothesen 
muss vielmehr die Untersuchungssituation so gestaltbar sein, dass alle nicht primar 
interessierenden Einflussfaktoren konstant gehalten oder zufallig verteilt werden 
konnen. Deshalb ist es unberechtigt, wenn psychologische Experimente immer 
wieder wegen ihrer Klinstlichkeit kritisiert werden. 903 

Die Entscheidung zwischen kiinstlichen Labor- und natiirlichen Feldunter- 
suchungen hangt demnach vor allem davon ab, auf welche Situation sich das 
betrachte Theorie-Element bezieht. Ob die intendierten Anwendungen natiirliche 
oder kontrollierte Situationen sind, kann fur verschiedene Elemente eines Theorie- 
Netzes unterschiedlich sein, denn eine Theorie kann sowohl kausale wie nicht- 
kausale Elemente umfassen. 

Wenn die intendierten Anwendungen eines Theorie-Elementes sowohl natiirliche 
wie kontrollierte Situationen umfassen, muss zur empirischen Abgrenzung des 
Geltungsbereichs sowohl auf Laborexperimente wie auf Felduntersuchungen zuriick- 
gegriffen werden. 



18.5 Abgrenzung von Geltungsbereichen 

Die Diskussionen um den Logischen Empirismus und den Kritischen Rationalismus 
haben gezeigt, dass sich weder die Wahrheit noch die Falschheit substanzwissen- 
schaftlicher Aussagen eindeutig nachweisen lasst. Verifikation und Falsifikation sind 
vielmehr nur Grenzfalle der Identifikation von erfolgreichen und nicht-erfolgreichen 
Anwendungen. Diese Abgrenzung von Geltungsbereichen hatten wir aus struktura- 
listischer Sicht als ein hauptsachliches Ziel der empirischen Forschung identifiziert. 
Wissenschaftlicher Erkenntnisgewinn besteht zu einem wesentlichen Teil darin, dass 
wir lernen, unter welchen Umstanden unsere Zusammenhangsannahmen und Erkla- 
rungsmodelle zutreffend sind und unter welchen Umstanden sie ungiiltig sind. Je 
breiter der Geltungsbereich einer Hypothese oder Theorie ist, desto starker ist sie 
empirisch gestiitzt oder, wenn man es so ausdrlicken will, “verifiziert”. 
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Theoretische Erkenntnisgewinne in den Wissenschaften sind allerdings haufig die 
Konsequenz von negativen, hypothesenkontraren empirischen Ergebnissen. Sie trei- 
ben uns dazu, verbesserte Beschreibungen und Erklarungen zu entwickeln. Eine 
Ersetzung oder, wenn man so will, “Falsifikation” der alten Theorie-Elemente ist um 
so eher gerechtfertigt, je vollstandiger die neuen Theorie-Elemente die Beschrei- 
bungs-, Erklarungs- und Vorhersageleistungen der alten mit umfassen und je besser 
sie sich bei kontrollierten empirischen Anwendungen bewahren. 

Mutige Hypothesen 

In einer Folge von Untersuchungen zur Abgrenzung der Menge erfolgreicher 
Anwendungen bringt es relativ wenig Erkenntnisgewinn, wenn man immer wieder 
sehr ahnliche Anwendungsfalle untersucht und wenn man dabei die empirischen 
Hypothesen ganz konsistent immer wieder akzeptieren oder ablehnen kann. Deshalb 
sollte man moglichst mutige Hypothesen aufstellen. Die zu einem Theorie-Element 
durchgefuhrten Untersuchungen sollten hinsichtlich der wesentlichen Personen- und 
Situationsmerkmale moglichst verschiedenartig sein. AuBerdem sollten dabei vor- 
zugsweise diejenigen moglichen Anwendungen untersucht werden, fur die es unter 
Beriicksichtigung aller verftigbaren Information besonders unsicher ist, ob die 
Theorie erfolgreich angewendet werden kann oder nicht. Dies konnen im Anfangs- 
stadium der Arbeit mit einer Theorie ganz andere Arten von empirischen Systemen 
sein als bei der Arbeit mit bereits sehr haufig angewendeten Theorien. Zuerst wird es 
vor allem interessant sein, ob die Theorie sich wenigstens unter fiir sie idealen 
Bedingungen bewahrt, wahrend es spater besonders informativ ist zu untersuchen, ob 
dies auch unter ungtinstigen Umstanden der Fall ist. 904 

Aus dent Labor ins Feld 

Wahrend man sich zu Anfang also gut mit den iiblichen Probandengruppen und 
Untersuchungskontexten zufrieden geben kann, sollte in spateren Anwendungen 
bevorzugt Neuland betreten werden. So kann man etwa die Grenze der erfolgreichen 
Anwendbarkeit einer Theorie insofern sukzessiv austesten, als man die Unter- 
suchungssituationen so wahlt, dass immer offenere, natlirlichere Systeme entstehen. 
AuBerdem kann man statt der iiblichen studentischen Probanden in spateren For- 
schungsstadien gezielt andersartige Probandengruppen einbeziehen. Auf diese Weise 
kann sich allmahlich ein differenziertes Bild dariiber ergeben, unter welchen 
Umstanden und fur welche Probandengruppen sich welches Element eines Theorie- 
Netzes gut oder weniger gut bewahren kann. 
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Theorie und Empirie 

Dieser Prozess der allmahlichen Abgrenzung der Geltungsbereiche einer Theorie 
illustriert eines der wichtigsten Ergebnisse unserer wissenschaftstheoretischen und 
methodischen Analysen: Wissenschaftliche Erkenntnis entsteht weder allein aus 
theoretischen Reflexionen noch allein aus empirischen Datenerhebungen. Wir brau- 
chen beides, um unser Wissen liber uns, die Menschen und die Welt zu verbessern: 
prazise, deutlich formulierte Theorien und valide, eindeutig interpretierbare empi- 
rische Untersuchungen. Vor allem brauchen wir aber eine fundierte Verbindung von 
Theorie und Erfahrung. Ich hoffe, in diesem Buch einige Anregungen dazu gegeben 
zu haben. 
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